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“这 是 一 本 条 理 清晰 并 且 深入 浅 出 的 教科 书 ， 这 部 教科 书包 含 传统 和 现代 计算 机 的 基本 原理 
0 Ssemugabi, 南非 大 学 计算 机 学 院 资深 讲师 


“本 书 并 没有 局 限于 计算 机 课程 的 入 门 班 ， 对 所 有 本 科 专 业 都 很 重要 。 本 书 不 仅 有 助 于 激发 学 生 

对 于 计算 机 科学 前 期 研究 的 兴趣 ;而 且 对 于 希望 快速 掌握 或 回顾 某 一 特定 课题 的 研究 者 来 说 ， 也 是 一 
本 很 好 的 参考 手册 。” 外 | 

一 Ronald Chikati， 非 洲 博茨瓦纳 会 计 掌 院 讲师 


《计算 机 科学 导论 》 是 国外 计算 机 等 上 T 相 关 专 业 本 科 生 的 一 本 基础 课 教材 ， 也 是 一 未 非常 经 旧 的 
计算 机 入 门 读物 。 作 为 一 本 百科 全 书 式 的 计算 机 专业 基础 入 门 读物 ， 书 中 涉及 计算 机 科学 的 方 方 面 
面 。 虽然 读 者 对 象 是 计算 机 专业 的 学 生 ， 但 这 本 书 深入 浅 出 ， 引 人 入 胜 ， 勾 画 出 计算 机 科学 体系 的 框 
架 ， 为 有 志 于 IT 行业 的 学 生 莹 定 计算 机 科学 知识 的 基础 ， 架 设 进一步 深入 专业 理论 学 习 的 桥梁 。 

本 书 是 基于 美国 计算 机 学 会 { ACM ) 推荐 的 CS0 课 程 设计 的 ， 从 广度 上 覆盖 了 计算 机 科学 所 有 的 
领域 ， 既 适合 国内 大 专 院 校 用 作 计 算 机 基础 课 教材 ， 也 可 以 供 有 意 在 计算 机 方面 发 展 的 非 计算 机 专业 
读者 作为 入 门 参考 。 - 


本 书 第 3 版 与 时 俱 进 ， 根 据 课程 要 求 进行 修改 ， 新 增 内 容 包括 
e 网 络 的 高 速 发 展 以 及 在 计算 机 科学 研究 中 的 运用 。 
e 新 的 安全 问题 。 
e 计算 机 技术 领域 的 最 新 进展 。 
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30 多 年 的 研发 和 教学 经 验 。 在 离开 工业 界 后 ， 他 在 德 安 扎 学 院 ( De Anza College ) 担任 计算 机 科学 磺 
授 ， 现 已 退休 。 除 了 这 本 教材 之 外 ， 他 还 编写 了 该 学 科 的 多 部 畅销 教材 。 
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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 湖 的 推动 下 ， 我国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 
日 益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 
战略 上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 
机 科学 发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接 
轨 、 建 设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华 章 公司 较 早 意识 到 “出 版 要 为 教育 服务 "。 自 1998 年 开始 ， 我 们 就 将 工作 
重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson，MecGraw-Hill， 
Elsevier，MIT，John Wiley 久 Sons，Cengage 等 世界 著名 出 版 公司 建立 了 良好 的 合作 关系 ， 从 
他 们 现 有 的 数 百 种 教材 中 颈 选 出 Andrew S. Tanenbaum，Bjarne Stroustrup ，Brain W. Kernighan ， 
Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. Ullman, Abraham 
Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy，Larry L. Peterson 等 大 师 
名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 从 书 ” 为 总 称 出 版 ， 供 读者 学 习 、 研 究 及 珍藏 。 大 理 
石 纹 理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提 供 了 
中 肯 的 选 题 指 导 ， 还 不 辞 劳 苦 地 担任 了 翻译 和 审 校 的 工作 ， 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ， 计 算 机 科学 丛书 ”已 经 出 版 了 近 两 
百 个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 。 
其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐渐 
深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 入 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 善 尽 
美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 对 我 们 
的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 
电子 邮件 : hzjsj@hzbook.com 3 
联系 电话 : (010) 88379604 | 
联系 地 址 ， 北 京 市 西城 区 百 万 庄 南 街 1 号 华章 教育 


邮政 编码 ，100037 华章 科技 图 书 出 版 中 心 
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从 我 2004 年 翻译 《计算 机 科学 导论 》 第 1 版 到 2015 年 翻译 该 书 第 3 版 ， 已 经 过 去 12 个 
年 头 了 。12 年 对 应 12 地 支 ， 恰 巧 是 中 国 传统 的 一 个 生肖 轮回 。 期 间 发 生 了 许多 事情 ， 包 括 和 
我 一 起 翻译 《计算 机 科学 导论 》 第 2 版 的 睦 高 峰 博士 在 第 2 版 新 书 上 市 前 不 幸 遇 难 ， 以 及 我 父 
亲 病 故 。12 年 ， 许 多 大 学 生 读 完 这 本 教材 跨 进 计算 机 领域 ,毕业 工作 ， 成 就 自己 的 I 开 事 业 。 
12 年 ， 我 们 见证 了 计算 机 行业 的 飞速 发 展 ， 从 桌面 应 用 到 互联 网 应 用 ， 再 延伸 到 移动 应 用 ， 
在 我 们 的 工作 和 生活 中 几乎 无 孔 不 人 。12 年 ,我 的 孩子 也 已 经 长 大 成 人 ,并 能 怀 着 浓厚 的 兴 
趣 协 助 我 一 起 翻译 。 

《计算 机 科学 导论 》 是 国外 计算 机 等 IT 相关 专业 大 学 生 的 基础 课 教材 ， 也 是 非常 经 典 的 一 
本 计算 机 入 门 读物 ， 通常 供 大 学 低 年 级 学 生 使 用 。 该 教材 是 一 本 百科 全 书 式 的 计算 机 专业 基础 
入门 读物 ， 涉 及 计算 机 科学 的 方方面面 。 虽 然 读者 对 象 是 计算 机 专业 的 学 生 ， 但 这 本 书 深入 浅 
出 ， 引 人 人 和 人 胜 ， 决 无 一 般 教 科 书 的 枯燥 和 了 临 涩 ， 所 以 也 适合 非 计 算 机 专业 人 员 阅 读 。 作 者 的 用 
意 显然 是 轻松 勾画 出 计算 机 科学 体系 的 框架 ， 为 有 志 于 IT 行业 的 学 生 葛 定 计算 机 科学 知识 的 
基础 ， 架 设 进 一 步 深 入 专业 理论 学 习 的 桥梁 。 作 者 在 这 本 书 中 强调 的 是 概念 而 不 是 数学 模型 和 
技术 细节 ， 并 通过 大 量 图 、 表 增强 读者 对 知识 的 理解 和 掌握 ， 通 过 范例 讲解 概念 和 相关 的 数学 
模型 ， 通 过 关键 术语 、 小 结 和 练习 帮助 读者 复习 巩固 学 习 效果 。 

本 书 是 基于 美国 计算 机 学 会 (ACM) 推荐 的 CS0 课程 设计 的 ， 它 从 广度 上 覆盖 了 计算 机 
科学 所 有 的 领域 。 这 本 书 既 适合 国内 大 专 院 校 用 作 计 算 机 基础 课 教材 ， 也 可 以 供 有 意 在 计算 机 
方面 发 展 的 非 计算 机 专业 读者 作为 人 门 参考 。 该 书 作为 一 本 成 熟 的 教材 已 经 被 国外 许多 大 学 选 
用 ,引进 翻译 显然 对 国内 的 计算 机 教学 有 着 重要 的 参考 价值 。 

该 书 前 两 版 由 我 们 翻译 出 版 后 被 国内 许多 重点 大 学 选用 并 受到 好 评 。 我 们 有 幸 继续 翻译 第 
3 版 ， 不 但 在 第 一 时 间 为 读者 奉 上 译 稿 ， 而 且 在 前 几 版 的 基础 上 精益 求 精 ， 对 一 些 术语 和 字句 
进行 推 殴 和 蔚 酌 ， 力 求 完美 。 在 翻译 过 程 中 ， 我 们 还 对 原 书 的 一 些 疏 漏 进行 了 更 正 。 

由 于 本 书 涉及 面 广 ， 技 术 内 容 新 ， 有 一 定 的 翻译 难度 ， 为 此 我 们 不 敢 疏 忽 。 如 果 读 者 在 阅 
读 中 发 现 我 们 的 工作 有 不 足 之 处 ， 敬 请 指正 。 

除 封 面 署名 译 者 外 ， 参 加 本 书 翻 译 和 校对 工作 的 还 有 许 大 琴 、 洪 蕾 、 吴 英 、 吴 永 逸 等 。 


刘 艺 
2015 年 5 月 27 日 
E-mail: my_reader@sina.com 
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计算 机 在 我 们 的 日 常生 活 中 扮演 了 一 个 重要 的 角色 ， 而 且 在 未 来 也 将 一 样 。 计 算 机 科学 是 
一 个 充满 了 挑战 和 发 展 机 遇 的 年 轻 学 科 。 计 算 机 网 络 将 处 在 地 球 上 每 一 个 角落 的 我 们 连接 在 一 
起 。 虚 拟 现实 创造 了 炫目 的 三 维 图 像 。 宇 宙 空 间 探险 的 成 功 也 部 分 归功 于 计算 机 的 发 展 。 计 算 
机 创建 的 特技 效果 改变 了 电影 行业 。 计 算 机 在 遗传 学 研究 中 也 扮演 了 一 个 重要 的 角色 。 


本 书 读者 对 象 

这 本 书 同时 面向 学 术 的 和 专业 的 读者 。 本 书 可 以 作为 感 兴趣 的 专业 人 士 的 自学 指南 。 作 为 
教材 ， 本 书包 含 一 学 期 (semester) 或 一 学 季 (quarter) 的 教学 内 容 ， 是 计算 机 科学 的 人 门 教程 。 
本 书 是 基于 美国 计算 机 学 会 (ACM) 推荐 的 CS0 课程 设计 的 。 它 从 广度 上 覆盖 了 计算 机 科学 
所 有 的 领域 。 其 他 领域 的 学 生 需 要 对 计算 机 科学 有 大 致 的 了 解 时 ， 无 论 是 从 本 书 中 选读 部 分 内 
容 还 是 通读 全 书 ， 都 有 帮助 。 


第 3 版 中 的 改动 


在 本 版 中 我 进行 了 以 下 几 类 修改 。 

1. 修订 的 章节 和 附录 

针对 教学 目的 ， 对 本 书 中 的 两 章 和 附录 进行 了 全 面 的 修订 。 

(1) 第 6 章 

为 了 更 便于 初次 接触 计算 机 网 络 的 学 生 进行 理解 ， 第 6 章 的 内 容 采 用 自 顶 向 下 的 教学 方法 
进行 修订 。 

(2) 第 16 章 

对 于 第 一 次 接触 计算 机 科学 的 学 生 而 言 ， 安 全 的 概念 普遍 较 难 接受 。 该 章 修 订 后 的 内 容 更 
通俗 易 懂 。 

(3 ) 附录 下 

该 附录 修订 后 的 内 容 增加 了 三 种 计算 机 语言 (C、C++ 和 Java) 的 一 些 简易 程序 例子 。 

2. 部 分 章节 中 的 细微 变化 

基于 书评 者 的 建议 ， 部 分 章节 的 格式 和 内 容 进 行 了 细微 的 修改 ， 并 且 部 分 章节 中 增加 了 一 
些 新 的 技术 。 

3. 章 末 材料 的 变化 

章 末 材料 主要 经 历 了 以 下 两 个 主要 的 变化 : 

e 每 章 最 后 的 多 选 题 被 删 去 了 ， 增 加 了 在 线 小 测验 ， 这 样 无 论 对 老师 检查 教学 成 果 ， 还 

是 学 生 进 行 检验 都 方便 许多 。 
e 每 章 结尾 增加 了 在 线 小 程序 来 帮助 学 生发 现 一 些 问 题 的 可 视 化 解决 方法 。 


组 织 
这 本 书 由 18 章 和 8 个 附录 构成 。 


1. 章节 

章节 的 作用 是 提供 基本 的 学 习 材料 ， 但 并 不 是 书 中 的 每 一 个 章节 都 对 学 生 有 利用 价值 。 教 
这 门 课 的 老师 可 以 自主 选择 教学 用 的 章节 。 我 们 会 在 后 面 提供 一 份 教学 指南 。 

2. 附录 

附录 的 作用 是 为 理解 书 中 讨论 的 概念 所 需 的 材料 提供 一 个 快速 的 参照 或 复习 。 本 书 中 有 8 
个 可 供 学 生 参 照 和 学 习 的 附录 。 

3. 缩 略 语 

本 书包 含 一 份 缩 略 语 表 来 帮助 快速 寻找 到 对 应 的 术语 。 

4. 术语 表 

为 了 使 学 生 熟 悉 书 中 使 用 的 术语 ， 本 书 提供 一 份 广泛 的 术语 表 。 


教学 法 


本 书 中 的 部 分 教学 法 是 为 使 学 生 可 以 非常 简便 地 理解 书 中 内 容 而 设计 的 。 

1. 图 文 并 上 茂 

本 书 图 文 并 茂 ， 而 且 不 使 用 复杂 的 公式 来 展示 高 深 内 容 。 本 书 附 图 超过 400 幅 ， 以 便 读 者 
形象 而 直观 地 了 解 本 书 内 容 。 图 片 对 于 解释 构成 整体 的 各 组 件 之 间 的 关系 极为 重要 。 对 于 很 多 
学 生来 说 ， 这 些 概念 通过 图 片 相 比 文字 更 容易 掌握 。 

2. 重点 

把 重要 的 概念 放 在 阴影 框 中 以 便 快 速 参考 和 即时 注意 。 

3. 范例 和 应 用 

在 合适 的 情况 下 ， 在 书 中 引入 了 可 以 说 明 概 念 的 例子 。 

4. 算 法 

第 3 版 增加 了 几 十 个 算法 ， 有 助 于 学 生 熟 悉 问 题 求解 和 编程 。 

5. UML 

本 书 通 篇 使 用 UML 图 以 使 学 生 熟 悉 该 工具 ， 因 为 这 已 经 成 为 业界 的 实际 标准 。 

6. 章 末 材 料 

每 一 章 以 一 系列 材料 结尾 ， 包 括 以 下 部 分 : 

(1 ) 推荐 读物 

这 部 分 给 出 该 章 推 荐 书目 列表 。 这 些 列表 也 用 于 参考 引用 。 

(2 ) 小 结 

每 章 结尾 的 小 结 都 包括 了 对 该 章 中 所 有 内 容 的 概括 。 小 结 把 该 章 最 重要 的 内 容 都 整合 在 一 
起 以 便 阅 读 。 

7. 练习 

每 章 包 括 为 强化 重要 概念 同时 鼓励 学 生 进 行 实践 而 设计 的 练习 。 练 习 包括 四 部 分 内 容 : 小 
测验 、 复 习题 、 练 习题 和 小 程序 。 

(1 ) 小 测验 

本 书 网 站 上 的 小 测验 提供 对 概念 掌握 情况 的 快速 测试 。 学 生 可 以 通过 这 些小 测验 来 检测 对 
所 学 内 容 的 理解 。 

(2 ) 复习 题 

这 个 部 分 包括 与 书 中 讨论 到 的 概念 有 关 的 简单 题 。 本 书 网 站 上 为 学 生 提供 了 奇数 编号 复习 


题 的 答案 以 供 核对 。 

(3 ) 练习 题 

这 一 部 分 包括 难度 更 大 的 题目 ， 这 些 题 目的 求解 需要 对 该 章 讨论 的 内 容 有 更 深层 次 的 理 
解 。 我 强烈 推荐 学 生 去 尝试 求解 这 部 分 的 全 部 题目 。 奇 数 编号 练习 题 的 答案 也 已 经 公布 在 了 本 
书 网 站 以 便 学 生 进 行 核对 。 

(4) 小 程序 

Java 小 程序 是 作者 编写 并 发 布 在 网 站 上 的 交互 式 试验 。 这 里 的 小 程序 有 些 用 于 更 好 地 理解 
部 分 练习 题 的 解答 ， 而 有 些 则 用 于 更 好 地 通过 实践 理解 网 络 的 概念 。 小 程序 是 为 了 简化 对 部 分 
范例 的 理解 而 专门 设计 的 。 


教师 资源 ” 
本 书 为 教 该 课程 的 老师 提供 完整 的 以 下 教学 资源 。 他 们 可 以 从 本 书 网 站 下 载 。 
1. 演示 文稿 
本 书 网 站 为 教授 该 课程 的 老师 提供 了 一 系列 彩色 的 、 动 画 式 的 幻灯 片 演示 文稿 。 
2. 练习 的 答案 
本 书 网 站 为 教授 该 课程 的 老师 提供 了 所 有 复习 题 和 练习 题 的 答案 。 


如 何 使 用 本 书 


本 书 的 章节 提供 了 较 大 的 灵活 性 组 织 。 我 建议 以 下 几 点 : 

e 第 1 ~ 8 章 内 容 对 理解 本 书 剩 下 内 容 而 言 是 必要 的 。 

e 如 果 时 间 允 许 ， 可 以 教授 第 9 ~ 14 章 内 容 。 在 学 季 制 (quarter) 中 这 些 内 容 可 以 
省 去 。 

e 第 15 一 18 章 内 容 的 教授 应 该 基于 学 生 的 专业 和 老师 的 辨别 力 进行 选择 。 
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绪 论 


今天 ， 计算 机 科学 一 词 是 一 个 非常 广泛 的 概念 。 尽 管 如 此 ， 在 本 书 里 ， 我 们 将 其 定义 为 
“和 计算 机 相关 的 问题 "。 本 章 首先 阐述 什么 是 计算 机 ， 接 着 探索 和 计算 机 直接 相关 的 一 些 问 
题 。 首 先 我 们 将 计算 机 看 成 一 个 图 灵 模 型 ， 这 是 从 数学 上 和 和 哲学 上 对 计算 的 定义 。 然 后 ， 阐 
明 当 今 的 计算 机 是 如 何 建立 在 冯 “' 诺 依 曼 模型 基础 上 的 。 最 后 介绍 计算 机 这 一 改变 文明 的 装 
置 的 简明 历史 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

e 定义 计算 机 的 图 灵 模 型 ; 

e 定义 计算 机 的 冯 “' 诺 依 曼 模型 ; 

。 描述 计算 机 的 三 大 部 分 : 硬件 、 数 据 和 软件 ; 

e 列举 与 计算 机 硬件 相关 的 话题 ; 

e 列举 与 数据 相关 的 话题 ; 

e 列举 与 软件 相关 的 话题 ; 

e 讨论 与 计算 机 使 用 相关 的 一 些 社会 问题 和 职业 道德 问题 ; 

e 说 出 计算 机 的 简明 历史 。 


1.1 图 灵 模 型 


Alan Turing (阿兰 图 灵 ) 在 1937 年 首次 提出 了 一 个 通用 计算 设备 的 设想 。 他 设想 所 
有 的 计算 都 可 能 在 一 种 特殊 的 机 器 上 执行 ， 这 就 是 现在 所 说 的 图 灵机 。 尽 管 图 灵 对 这 样 一 种 
机 器 进行 了 数学 上 的 描述 ， 但 他 还 是 更 有 兴趣 关注 计算 的 哲学 定义 ， 而 不 是 建造 一 台 真 实 的 
机 器 。 他 将 该 模型 建立 在 人 们 进行 计算 过 程 的 行为 上 ， 并 将 这 些 行为 抽象 到 用 于 计算 的 机 器 
的 模型 中 ， 这 才 真正 改变 了 世界 。 


1.1.1 数据 处 理 器 


在 讨论 图 灵 模 型 之 前 ， 让 我 们 把 计算 机 定义 成 一 个 数据 处 理 器 。 依 照 这 种 定义 ， 计 算 机 
就 可 以 被 看 作 是 一 个 接受 输入 数据 、 处 理 数 据 并 产生 输出 数据 的 黑 盒 (如 图 1-1 所 示 )。 尽 


管 这 个 模型 能 够 体现 现代 计算 机 的 功能 ， 但 是 es 

它 的 定义 还 是 太 宽泛 。 按 照 这 种 定义 ， 也 可 以 答 入 数 器 一 | 计算 机 。 | 一 输出 数据 
认为 便携 式 计算 器 是 计算 机 (按照 字面 意思 ， 图 1-1 单 任务 计算 机 竹 

它 也 符合 定义 的 模型 )。 


另 一 个 问题 是 这 个 模型 并 没有 说 明 它 处 理 的 类 型 以 及 是 否 可 以 处 理 一 种 以 上 的 类 型 。 换 
名 话说， 它 并 没有 清楚 地 说 明基 于 这 个 模型 的 机 器 能 够 完成 操作 的 类 型 和 数量 。 它 是 专用 机 
器 还 是 通用 机 器 呢 ? 

这 种 模型 可 以 表示 为 一 种 设计 用 来 完成 特定 任务 的 专用 计算 机 (或 者 处 理 器 )， 比 如 用 
来 控制 建筑 物 温度 或 汽车 油料 使 用 。 尽 管 如 此 ， 计 算 机 作为 一 个 当今 使 用 的 术语 ， 是 一 种 通 
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用 的 机 器 ， 它 可 以 完成 各 种 不 同 的 工作 。 这 表明 我 们 需要 将 该 模型 改变 为 图 灵 模 型 来 反映 当 
今 计算 机 的 现实 。 


1.1.2 ”可 编程 数据 处 理 器 


图 灵 模 型 是 一 个 适用 于 通用 计算 机 的 更 好 
模型 。 该 模型 添加 了 一 个 额外 的 元 素 一 一 程序 
到 不 同 的 计算 机 器 中 。 程 序 是 用 来 告诉 计算 机 输入 数据 
0 ry 众人 信人 -2 显示 
| 国人 

在 这 个 图 灵 模 型 中 ， 输 出 数据 是 依赖 两 方面 因素 的 结合 作用 : 输入 数据 和 程序 。 对 于 相 
同 的 数据 输入 ， 如 果 改 变 程序 ， 则 可 以 产生 不 同 的 输出 。 类 似 地 ， 对 于 同样 的 程序 ， 如 果 改 
变 输 入 数据 ， 其 输出 结果 也 将 不 同 。 最 后 ， 如 果 输 入 数据 和 程序 保持 不 变 ， 输 出 结果 也 将 不 
变 。 让 我 们 看 看 下 面 三 个 示例 。 

1. 相同 的 程序 ， 不 同 的 输入 数据 

图 1-3 显示 了 对 于 同样 的 程序 输入 不 同 的 数据 时 ， 尽 管 程序 相同 ， 但 因为 处 理 的 输入 数 
据 不 同 , 输出 也 就 不 同 。 

2. 相同 的 输入 数据 ， 不 同 的 程序 

图 1-4 显示 了 对 于 不 同 的 程序 输入 相同 的 数据 时 的 情形 。 每 个 程序 使 计算 机 对 相同 的 输 
入 数据 执行 不 同 的 操作 。 第 一 个 程序 是 使 输入 数据 按 大 小 顺序 排列 ， 第 二 个 程序 是 使 所 有 的 
数据 相 加 ， 第 三 个 程序 是 找 出 输入 数据 中 最 小 的 数 。 
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计算 机 输出 数据 
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图 1-3 ”相同 的 程序 ， 不同 的 数据 
3. 相同 的 输入 数据 ， 相 同 的 程序 





3, 12, 8, 22 
输入 数据 





3, 12, 8, 22 


3 
输入 数 据 计算 机 输出 数据 


图 1-4 相同 的 数据 ， 不 同 的 程序 


我 们 希望 无 论 何 时 对 于 同样 的 输入 数据 和 程序 ， 其 输出 结果 一 致 。 换 句 话 说 ， 当 程序 在 


输入 相同 的 数据 运行 时 ， 我 们 希望 有 相同 的 输出 。 


1.1.3 ”通用 图 灵机 


通用 图 灵机 是 对 现代 计算 机 的 首次 描述 ， 该 机 器 只 要 提供 了 合适 的 程序 就 能 做 任何 运 
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算 。 可 以 证 明 ， 一 台 很 强大 的 计算 机 和 通用 图 灵机 一 样 能 进行 同样 的 运算 。 我 们 所 需要 的 仅 
仅 是 为 这 两 者 提供 数据 以 及 用 于 描述 如 何 做 运算 的 程序 。 实 际 上 ， 通 用 图 灵机 能 做 任何 可 计 
算 的 运算 。 

1.2 冯 … 诺 依 曼 模 型 


基于 通用 图 灵机 建造 的 计算 机 都 是 在 存储 器 中 储存 数据 。 在 1944 ~ 1945 年 期 间 ， 
冯 “' 诺 依 曼 指 出 ， 鉴 于 程序 和 数据 在 逻辑 上 是 相同 的 ， 因 此 程序 也 能 存储 在 计算 机 的 存储 
器 中 。 


1.2.1 4 个 子 系统 


基于 冯 “' 诺 依 曼 模型 建造 的 计算 机 分 为 4 个 子 系统 : 存储 器 、 算 术 逻 辑 单 元 、 控 制 单元 
和 输入 /输出 单元 ( 见 图 1-5 ) 。 


计算 机 


输入 数据 输出 数据 





图 1-5 冯 : 诺 依 曼 模型 


1. 存储 器 

存储 器 是 用 来 存储 的 区 域 ， 在 计算 机 的 处 理 过 程 中 存储 器 用 来 存储 数据 和 程序 ， 我 们 将 
在 这 一 章 后 边 讨 论 存储 数据 和 程序 的 原因 。 

2. 算术 逻辑 单元 

算术 逻辑 单元 (ALU) 是 用 来 进行 计算 和 逻辑 运算 的 地 方 。 如 果 是 一 台数 据 处 理 计算 
机 ， 它 应 该 能 够 对 数据 进行 算术 运算 (例如 进行 一 系列 的 数字 相 加 运算 )。 当 然 它 也 应 该 可 
以 对 数据 进行 一 系列 逻辑 运算 ， 正 如 我 们 将 在 第 4 章 看 到 的 那样 。 

3. 控制 单元 

控制 单元 是 对 存储 器 、 算 术 逻 辑 单元 、 输 入 /输出 等 子 系统 进行 控制 操作 的 单元 。 

4. 输入 /输出 

输入 子 系统 负责 从 计算 机 外 部 接收 输入 数据 和 程序 ; 输出 子 系统 负责 将 计算 机 的 处 理 
结果 输出 到 计算 机 外 部 。 输 入 /输出 子 系统 的 定义 相当 广泛 ， 它 们 还 包含 辅助 存储 设备 ， 例 
如 ， 用 来 存储 处 理 所 需 的 程序 和 数据 的 磁盘 和 磁带 等 。 当 一 个 磁盘 用 于 存储 处 理 后 的 输出 结 
果 ， 我 们 一 般 就 可 以 认为 它 是 输出 设备 ， 如 果 从 该 磁盘 上 读 取 数据 ， 则 该 磁盘 就 被 认为 是 输 
入 设备 。 


1.2.2 存储 程序 概念 


冯 “' 诺 依 曼 模 型 中 要 求 程序 必须 存储 在 内 存 中 。 这 和 早期 只 有 数据 才 存 储 在 存储 器 中 
的 计算 机 结构 完全 不 同 。 完 成 某 一 任务 的 程序 是 通过 操作 一 系列 的 开关 或 改变 其 配 线 来 实 
现 的 。 
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现代 计算 机 的 存储 单元 用 来 存储 程序 及 其 响应 数据 。 这 意味 着 数据 和 程序 应 该 具有 相同 
的 格式 ， 这 是 因为 它们 都 存储 在 存储 器 中 。 实 际 上 它们 都 是 以 位 模式 (0 和 1 序列 ) 存储 在 
内 存 中 的 。 


1.2.3 ”指令 的 顺序 执行 


冯 “' 诺 依 曼 模型 中 的 一 段 程序 是 由 一 组 数量 有 限 的 指令 组 成 。 按 照 这 个 模型 ， 控 制 单元 
从 内 存 中 提取 一 条 指令 ， 解 释 指令 ， 接 着 执行 指令 。 换 名 话说， 指令 就 一 条 接着 一 条 地 顺序 
执行 ， 当 然 ， 一 条 指令 可 能 会 请 求 控制 单元 以 便 跳 转 到 其 前 面 或 者 后 面 的 指令 去 执行 ， 但 是 
这 并 不 意味 着 指令 没有 按照 顺序 来 执行 。 指 令 的 顺序 执行 是 基于 冯 “' 诺 依 曼 模型 的 计算 机 的 
初始 条 件 。 当 今 的 计算 机 以 最 高 效 的 顺序 来 执行 程序 。 


1.3 ”计算 机 组 成 部 分 
我 们 可 以 认为 计算 机 由 三 大 部 分 组 成 : 计算 机 硬件 、 数 据 和 计算 机 软件 。 


1.3.1 计算 机 硬件 


当今 的 计算 机 硬件 基于 冯 “ 诺 依 曼 模 型 ， 且 包含 四 部 分 ， 尽 管 可 以 有 不 同类 型 的 存储 单 
元 ,不 同类 型 的 输入 /输出 子 系统 等 。 在 第 5 章 我 们 将 详细 讨论 计算 机 硬件 。 


1.3.2 ”数据 


冯 : 诺 依 曼 模 型 清楚 地 将 一 台 计 算 机 定义 为 一 台数 据 处 理 机 。 它 接收 输入 数据 ， 处 理 并 
输出 相应 的 结果 。 

1. 存储 数据 

冯 : 诺 依 曼 模型 并 没有 定义 数据 如 何 存储 在 计算 机 中 。 如 果 一 台 计 算 机 是 一 人 台电 子 设 
备 ， 最 好 的 数据 存储 方式 应 该 是 电子 信号 ， 例 如 以 电子 信和 号 的 出 现 和 消失 的 特定 方式 来 存储 
数据 ， 这 意味 着 一 台 计 算 机 可 以 以 两 种 状态 之 一 的 形式 来 存储 数据 。 

显然 ， 在 日 常 使 用 的 数据 并 不 是 以 两 种 状态 之 一 的 形式 存在 ， 例 如 ， 我 们 在 数字 系统 中 
使 用 的 数字 可 以 是 0 ~ 9 十 种 状态 中 的 任何 一 个 。 但 是 你 不 能 (至 少 到 目前 为 止 ) 将 这 类 信 
息 存 储 到 计算 机 内 部 ， 除 非 将 这 类 信息 变换 成 另 一 种 只 使 用 两 种 状态 (0 和 1 ) 的 系统 。 同 
样 ， 你 也 需要 处 理 其 他 类 型 的 数据 (例如 文本 、 图 像 、 声 音 、 视 频 )， 它 们 同样 也 不 能 直接 
存储 到 计算 机 中 ， 除 非 将 它们 转变 成 合适 的 形式 (0 和 1 序列 )。 

在 第 3 章 中 ， 我们 将 会 了 解 不 同类 型 的 数据 是 怎样 以 0 和 1 序列 的 二 进 制 的 形式 存 
储 在 计算 机 内 部 的 。 第 4 章 将 介绍 在 计算 机 内 部 由 二 进 制 组 成 的 数据 是 怎样 被 操作 处 
理 的 。 

2. 组 织 数据 

尽管 数据 只 能 以 一 种 形式 (位 模式 ) 存储 在 计算 机 内 部 ， 但 在 计算 机 外 部 却 可 以 表现 
为 不 同 的 形式 。 另 外 ， 计 算 机 (以 及 数据 处 理 表示 法 ) 开创 了 一 门 新 兴 的 研究 领域 一 一 数 
据 组 织 。 在 将 数据 存储 到 计算 机 中 之 前 ， 能 否 有 效 地 将 数据 组 织 成 不 同 的 实体 和 格式 ? 如 
今 ， 数 据 并 不 是 按照 杂乱 无 章 的 次 序 来 组 织 信息 的 。 数 据 被 组 织 成 许多 小 的 单元 ， 再 由 
这 些小 的 单元 组 成 更 大 的 单元 ， 等 等 。 在 第 11 ~ 14 章 中 ， 我 们 将 会 从 这 个 角度 去 认识 
数据 。 
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1.3.3 ”计算 机 软件 


图 灵 或 汉 . 诺 依 曼 模型 的 主要 特征 是 程序 的 概念 。 尽 管 早期 的 计算 机 并 没有 在 计算 机 的 
存储 器 中 存储 程序 ， 但 它们 还 是 使 用 了 程序 的 概念 。 编 程 在 早期 的 计算 机 中 体现 为 系列 开关 
的 打开 或 闭合 以 及 配 线 的 改变 。 编 程 在 数据 实际 开始 处 理 之 前 是 由 操作 员 或 工程 师 完成 的 一 
项 工作 。 

1. 程序 必须 是 存储 的 

在 汉 . 诺 依 曼 模型 中 ， 这 些 程序 被 存储 在 计算 机 的 存储 器 
中 ， 存 储 器 中 不 仅 要 存储 数据 ， 还 要 存储 程序 ( 见 图 1-6 )。 

2. 指令 的 序列 

这 个 模型 还 要 求 程序 必须 是 有 序 的 指令 集 。 每 一 条 指令 全 人 
操作 一 个 或 者 多 个 数据 项 。 因 此 ， 一 条 指令 可 以 改变 它 前 面 指 图 1-6 存储 器 中 的 程序 和 数据 
令 的 作用 。 例 如 ， 图 1-7 显示 了 一 个 输入 两 个 
数据 ， 将 它们 相 加 ， 最 后 打印 出 结果 的 程序 。 
这 段 程序 包含 4 个 独立 的 指令 集 。 

也 许 我 们 会 问 为 什么 程序 必须 由 不 同 的 
指令 集 组 成 ， 答 案 是 重用 性 。 如 今 ， 计 算 机 








程序 
完成 成 千 上 万 的 任务 ， 如 果 每 一 项 任务 的 程 图 1-7 由 指令 组 成 的 程序 


序 都 是 相对 独立 而 且 和 其 他 程序 之 间 没 有 任 


何 的 公用 段 ， 编 程 将 会 变 成 一 件 很 困难 的 事情 。 图 灵 模 型 和 冯 “ 诺 依 曼 模型 通过 仔细 地 定义 
计算 机 可 以 使 用 的 不 同 指令 集 ， 从 而 使 得 编程 变 得 相对 简单 。 程 序 员 通 过 组 合 这 些 不 同 的 指 
令 来 创建 任意 数量 的 程序 。 每 个 程序 可 以 是 不 同 指令 的 不 同 组 合 。 

3. 算法 

要 求 程序 包含 一 系列 指令 使 得 编程 变 得 可 能 ， 但 也 带 来 了 另外 一 些 使 用 计算 机 方面 的 问 
题 。 程 序 员 不 仅 要 了 解 每 条 指令 所 完成 的 任务 ， 还 要 知道 怎样 将 这 些 指令 结合 起 来 完成 一 些 
特定 的 任务 。 对 于 一 些 不 同 的 问题 ， 程 序 员 首先 应 该 以 循序 渐进 的 方式 来 解决 问题 ， 接 着 尽 
量 找到 合适 的 指令 (指令 序列 ) 来 解决 问题 。 这 种 按 步骤 解决 问题 的 方法 就 是 所 谓 的 算法 。 
算法 在 计算 机 科学 中 起 到 了 重要 的 作用 ， 我 们 将 在 第 8 章 讨论 。 

4. 语言 ， 

在 计算 机 时 代 的 早期 ， 只 有 一 种 称 为 机 器 语言 的 计算 机 语言 。 程 序 员 依 靠 写 指令 的 方式 
(使 用 位 模式 ) 来 解决 问题 。 但 是 随 着 程序 越 来 越 大 ， 采 用 这 种 模式 来 编写 很 长 的 程序 变 得 
单调 乏味 。 计 算 机 科学 家 们 研究 出 利用 符号 来 代表 位 模式 ， 就 像 人 们 在 日 常 中 用 符号 (单词 ) 
来 代替 一 些 常 用 的 指令 一 样 。 当 然 ， 人 们 在 日 常生 活 中 所 用 的 一 些 符 号 与 计算 机 中 所 用 的 符 
号 不 同 。 这 样 计算 机 语言 的 概念 诞生 了 。 自 然 语言 (例如 英语 ) 是 丰富 的 语言 ， 并 有 许多 正 
确 组 合 单词 的 规则 ; 相对 而 言 ， 计 算 机 语言 只 有 比较 有 限 的 符号 和 单词 。 第 9 章 将 介绍 计算 
机 语言 。 

5. 软件 工程 

在 冯 “' 诺 依 曼 模型 中 没有 定义 软件 工程 ， 软 件 工程 是 指 结构 化 程序 的 设计 和 编写 。 今 
天 ， 它 不 仅仅 是 用 来 描述 完成 某 一 任务 的 应 用 程序 ， 还 包括 程序 设计 中 所 要 严格 遵循 的 原理 
和 规则 。 我 们 所 讨论 的 这 些 原理 和 规则 综合 起 来 就 是 第 10 章 中 要 说 的 软件 工程 。 





6. 操作 系统 

在 计算 机 发 展演 变 过 程 中 ， 科 学 家 们 发 现 有 一 系列 指令 对 所 有 程序 来 说 是 公用 的 。 例 
如 ， 一 条 告诉 计算 机 在 哪 接收 和 发 送 数据 的 指令 在 几乎 所 有 的 程序 中 都 要 用 到 。 如 果 这 些 指 
令 只 编写 一 次 就 可 以 用 于 所 有 程序 ， 那 么 效率 将 会 大 大 提高 。 这 样 ， 就 出 现 了 操作 系统 的 概 
念 。 计 算 机 操作 系统 最 初 是 为 程序 访问 计算 机 部 件 提 供 方 便 的 一 种 管理 程序 。 今 天 ， 操 作 系 
统 所 完成 的 工作 远 不 止 这 些 ， 具 体 的 内 容 将 在 第 7 章 介 绍 。 


1.4 历史 
在 本 节 ， 我 们 简要 回顾 一 下 计算 和 计算 机 的 历史 。 我 们 将 其 分 为 三 个 阶段 。 


1.4.1 ”机械 计算 机 器 ( 1930 年 以 前 ) 


在 这 个 阶段 ， 人 们 发 明了 一 些 用 来 进行 计算 的 机 器 ， 它 们 与 计算 机 的 现代 概念 几乎 没有 
相似 之 处 。 

e 在 17 世 纪 ， 法 国 著名 的 数学 家 和 物理 学 家 布 莱 斯 .帕斯卡 (Blaise Pascal) 发 明了 
Pascsline， 一 个 用 来 进行 加 减 运算 的 计算 机 器 。 到 了 20 世纪 ， 当 尼克 劳 斯 沃 思 
( Niklaus Wirth) 发 明了 一 种 结构 化 的 程序 设计 语言 ， 他 将 其 命名 为 Pascal 语言 ， 用 
来 纪念 这 位 发 明 首 台 机 械 计 算 器 的 科学 家 。 

在 17 世纪 后 期 ， 德 国 数学 家 戈 特 弗 里 德 ， 莱 布 尼 茨 (Gottfried Leibnitz) 发 明了 既 能 
够 做 乘除 运算 又 能 做 加 减 运算 的 一 台 更 加 复杂 的 计算 机 器 。 这 台 机 器 被 称 为 莱 布 尼 
茨 之 轮 (Leibnitz's Wheel) 。 

第 一 台 利用 存储 和 编程 概念 的 机 器 是 雅 卡尔 提花 织 机 ( Jacquard loom)， 它 是 由 约 瑟 
夫 - 玛丽 . 雅 卡尔 (Joseph-Marie Jacquard) 在 19 世纪 初期 发 明 的 。 这 种 织 布 机 是 利 
用 穿孔 卡 (类似 于 存储 程序 ) 来 控制 在 织 布 过 程 中 经 线 的 提升 。 

1823 年 ， 查 尔 斯 . 巴 比 奇 ( Charles Babbage) 发 明了 一 种 差分 引擎 ， 它 不 仅 能 够 很 
容易 地 进行 数学 运算 ， 还 可 以 解 多 项 式 方程 。 后 来 ， 他 发 明了 一 种 叫做 分 析 引 擎 的 
机 器 ， 在 某 种 程度 上 和 现代 计算 机 的 概念 类 似 。 该 机 器 有 4 个 组 成 部 分 ， 一 个 制造 
场 (现在 的 算术 逻辑 单元 )、 一 个 存储 单元 (存储 器 )、 一 个 操作 者 (控制 单元 ) 和 输 
出 单元 (输入 /输出 )。 

1890 年 ， 在 美国 人 口 普查 办 公 室 工作 的 赫 尔 曼 : 何 勒 里 斯 ( Herman Hollerith) 设计 
并 制造 出 具有 编程 能 力 的 机 器 ， 该 机 器 可 以 自动 阅读 、 计 数 和 排列 存储 在 穿孔 卡 上 
的 数据 。 


1.4.2 ”电子 计算 机 的 诞生 ( 1930 ~ 1950 年 ) 


1930 ~ 1950 年 ， 那 些 被 视 为 电子 计算 机 工业 先驱 的 科学 家 们 发 明了 一 些 计算 机 。 
1. 早期 的 电子 计算 机 
这 一 时 期 的 早期 计算 机 并 不 是 将 程序 存储 到 存储 器 中 ， 所 有 的 计算 机 都 是 在 外 部 进行 编 
程 的 。 有 以 下 5 种 比较 杰出 的 计算 机 : 
e 第 一 台 用 来 完成 特定 任务 的 计算 机 是 通过 将 信息 进行 电子 编码 来 实现 其 功能 的 ， 它 
是 由 约翰 . 阿 塔 纳 索 夫 (John V. Atanasoff) 及 其 助手 克利 福 德 . 贝 里 (Clifford 
Berry) 于 1939 年 发 明 的 。 它 又 被 称 为 ABC ( Atanasoff Berry Computer)， 主 要 用 于 


实现 解 线性 方程 的 系统 。 
e 在 同一 时 期 ， 名 为 康 拉 德 . 朱 斯 (Konrad Zuse) 的 德国 数学 家 设计 出 通用 计算 机 ， 
并 命名 为 “Z1”。 


在 20 世纪 30 年代， 美国 海军 和 IBM 公司 在 哈佛 大 学 发 起 创建 了 一 项 工程 ， 在 霍 华 
德 . 艾 肯 (Howard Aiken) 的 直接 领导 下 发 明 建造 了 一 台 名 为 Mark I 的 巨型 计算 机 。 
这 种 计算 机 既 使 用 了 电子 部 件 ， 也 使 用 了 机 械 部 件 。 
在 英国 ， 阿 兰 . 图 灵 发 明了 一 台 名 为 巨人 (Colossus) 的 计算 机 ， 这 人 台 计 算 机 是 为 破 
译 德 国 Enigma 密码 而 设计 的 。 
第 一 台 通 用 的 、 完 全 电子 的 计算 机 由 约翰 . 莫 奇 勒 (John Mauchly) 和 普 雷 斯 波 : 埃 
克 特 (J. Presper Eckert) 发 明 ， 这 台 计 算 机 被 称 为 ENIAC (了 Electronic Numerical 
Integrator and Calculator， 电 子 数 字 集 成 器 和 计算 器 )。 它 是 在 1946 年 完成 设计 的 ， 
利用 了 将 近 18 000 个 集成 块 ， 有 100 英尺 长 ，10 米 英尺 高 ， 重 达 30 吨 。 

2. 基于 冯 “ 诺 依 曼 模型 的 计算 机 

前 面 5 种 计算 机 的 存储 单元 仅仅 用 来 存放 数据 。 它 们 利用 配 线 或 开关 进行 外 部 编程 。 
冯 “' 诺 依 曼 提 出 了 程序 和 数据 应 该 存储 在 存储 器 中 。 按 照 这 种 方法 ， 每 次 使 用 计算 机 来 完成 
一 项 新 的 任务 。 你 只 需要 改变 程序 ， 而 不 用 重新 布线 或 者 调节 成 百 上 千 的 开关 。 

第 一 台 基 于 冯 氏 思想 的 计算 机 于 1950 年 在 宾夕法尼亚 大 学 诞生 ， 命 名 为 EDVAC。 与 
此 同时 ， 英 国 剑桥 大 学 的 莫 里 斯 威 尔 克 斯 (Maurice Wilkes) 制造 了 同样 类 型 的 被 称 为 
EDSAC 的 计算 机 。 


1.4.3 ”计算 机 的 诞生 ( 1950 年 至 今 ) 


1950 年 以 后 出 现 的 计算 机 都 差不多 基于 汉 ' 诺 依 曼 模 型 。 它 们 变 得 更 快 、 更 小 、 更 便 
宜 , 但 原理 几乎 是 相同 的 。 历 史学 家 将 这 一 时 期 划分 为 几 代 ， 每 一 代 计 算 机 的 改进 主要 体现 
在 硬件 或 软件 方面 (而 不 是 模型 )。 

1. 第 一 代 计 算 机 

第 一 代 计 算 机 (大约 1950 ~ 1959 年 ) 以 商用 计算 机 的 出 现 为 主要 特征 。 在 这 个 时 期 ， 
计算 机 只 有 专家 们 才能 使 用 。 它 们 被 锁 在 房子 里 ， 限 制 操 作者 和 计算 机 专家 以 外 的 人 员 进 
人 。 计 算 机 体积 庞大 ， 且 使 用 真空 管 作 为 电子 开关 。 此 时 的 计算 机 只 有 大 的 机 构 才 能 负担 
得 起 。 

2. 第 二 代 计 算 机 

第 二 代 计 算 机 (大 约 1959 ~ 1965 年 ) 使 用 品 体 管 代替 真空 管 。 这 既 减 小 了 计算 机 的 
体积 ， 也 节省 了 开支 ， 从 而 使 得 中 小 型 企业 也 可 以 负担 得 起 。FORTRAN 和 COBOL (参见 
第 9 章 ) 两 种 高 级 计算 机 程序 设计 语言 的 发 明 使 得 编程 更 加 容易 。 这 两 种 语言 将 编程 任务 和 
计算 机 运算 任务 分 离开 来 。 一 个 土木 工程 师 能 够 直接 编写 一 个 FORTRAN 程序 来 解决 问题 ， 
而 不 必 涉 及 计算 机 结构 中 的 具体 电子 细节 。 

3. 第 三 代 计 算 机 

集成 电路 (晶体管 、 导 线 以 及 其 他 部 件 做 在 一 块 单 芯 片上 ) 的 发 明 更 加 减少 了 计算 机 的 
成 本 和 大 小 。 小 型 计算 机 出 现在 市 场 上 。 封 装 的 程序 ， 就 是 通常 所 说 的 软件 包 也 已 经 有 售 。 
小 型 公司 可 以 买 到 需要 的 软件 包 (如 会 计 程 序 )， 而 不 必 写 自己 的 程序 。 一 个 新 的 工业 
软件 工业 就 此 诞生 了 。 这 个 时 期 大 概 从 1965 年 持续 到 1975 年 。 





4. 第 四 代 计 算 机 

第 四 代 计 算 机 (大 约 1975 ~ 1985 年 ) 出 现 了 微型 计算 机 。 第 一 个 桌面 计算 器 ( Altair 
8800 ) 出 现在 1975 年 。 电 子 工业 的 发 展 允 许 整 个 计算 机 子 系统 做 在 单 块 电路 板 上 。 这 一 时 
代 还 出 现 了 计算 机 网 络 (参见 第 6 章 )。 

5. 第 五 代 计 算 机 

这 个 还 未 终止 的 时 代 始 于 1985 年 。 这 个 时 代 见 证 了 掌上 计算 机 和 台式 计算 机 的 诞生 、 
第 二 代 存 储 媒体 (CD-ROM、DYVD 等 ) 的 改进 、 多 媒体 的 应 用 以 及 虚拟 现实 现象 。 


1.5 ”社会 问题 和 道德 问题 
计算 机 科学 引发 了 一 些 周遭 的 问题 ， 其 中 最 为 普遍 的 可 以 归 类 为 社会 问题 和 道德 问题 。 
1.5.1 ”社会 问题 


计算 机 已 经 引起 了 一 些 争论 。 我 们 在 这 里 介绍 部 分 的 争论 。 

1. 依赖 

计算 机 科学 已 经 注定 改变 了 我 们 的 社会 。 根 据 最 近 的 调查 ， 超 过 一 半 的 美国 家 庭 使 用 计 
算 机 上 网 。 大 多 数 人 使 用 计算 机 的 社会 会 是 一 个 更 好 的 社会 吗 ? 一 些 人 认为 在 每 个 人 的 生活 
中 都 不 可 避免 用 到 计算 机 : 离开 它 就 很 难 生活 ; 而 另 一 些 人 则 认为 计算 机 已 经 构成 了 一 种 依 
赖 。 后 者 认为 这 种 新 的 依赖 就 像 其 他 种 类 的 依赖 一 样 ， 使 得 人 们 的 生活 更 困难 。 

2. 社会 公正 

社会 公正 是 我 们 经 常 听 到 的 另 一 个 问题 。 该 问题 的 支持 者 辩 称 在 家 使 用 计算 机 不 是 所 有 
人 都 能 付 得 起 的 奢侈 行为 。 计 算 机 的 花费 、 外 围 设备 以 及 每 月 支付 的 上 网 费 对 低 收入 家 庭 是 
额外 的 负担 。 这 意味 着 计算 机 已 经 构成 仅 为 中 高 收入 人 群 的 服务 ， 而 低 收 入 人 和 群 被 剥夺 了 权 
利 。 反 对 者 则 认为 ， 当 其 他 诸如 电话 和 电视 等 现代 通信 服务 建立 起 来 时 ， 同 样 的 问题 就 已 经 
产生 了 。 他 们 争辩 道 ， 随 着 技术 的 进步 ， 总 有 一 天 人 人 都 能 负担 起 计算 机 成 本 以 及 上 网 费 。 

3. 数字 化 分 裂 

数字 化 分 裂 的 概念 包括 前 面 讨 论 过 的 依赖 和 社会 公正 问题 。 这 个 概念 将 社会 分 裂 成 两 大 
组 群 : 那些 与 社会 其 他 部 分 以 电子 形式 联系 在 一 起 的 人 ， 以 及 那些 没有 以 电子 形式 联系 在 一 
起 的 人 。 前 一 组 群 中 的 某 些 人 通过 电子 邮件 与 本 组 群 的 人 们 通信 ， 使 用 因特网 进行 电子 商务 
或 娱乐 。 后 一 组 群 中 的 一 些 人 使 用 传统 的 邮件 和 电话 交流 ， 喜 欢 坐 在 电影 院 里 看 电影 而 不 是 
通过 网 络 下 载 影片 。 这 种 数字 化 分 裂 在 工业 化 国家 正在 渐渐 消失 ， 但 是 专家 们 相信 它 将 在 发 
展 中 国家 持续 很 长 时 间 。 


1.5.2 ”道德 问题 


计算 机 造成 了 一 些 道德 问题 。 我 们 在 这 里 介绍 其 中 一 些 。 

1. 隐私 

计算 机 人 允许 两 方 之 间 通 过 电子 方式 进行 通信 。 但 是 ， 为 了 确保 这 种 通信 的 私密 性 需要 做 
很 多 工作 。 社 会 正在 为 私密 的 电子 通信 支付 高 昂 的 费用 。 网 络 安全 (第 16 章 ) 可 以 创建 这 
种 私密 性 ， 但 是 这 需要 大 量 的 努力 和 花费 。 

2. 版 权 

在 计算 机 化 的 社会 中 ， 另 一 个 道德 问题 是 版 权 : 谁 拥有 数据 ?因特网 已 经 为 思想 共享 创 
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造 了 机 会 ， 但 还 是 带 来 更 深 的 道德 问题 : 电子 版 权 。 

3. 计算 机 犯罪 

如 同 任何 创新 一 样 ， 计 算 机 和 信息 技术 带 来 了 新 的 犯罪 。 黑 客 已 经 能 够 访问 世界 上 的 很 
多 计算 机 并 盗 取 大 量 金钱 。 病 毒 制造 者 设计 出 通过 因特网 发 送 的 新 病毒 并 摧毁 存储 在 计算 机 
中 的 信息 。 尽 管 今天 有 很 多 杀毒 软件 在 使 用 ， 社 会 正在 为 这 类 犯罪 支付 高 昂 的 费用 ， 而 这 类 
犯罪 在 计算 机 和 网 络 时 代 之 前 并 不 存在 。. 
1.6 计算 机 科学 作为 一 门 学 科 

随 着 计算 机 的 发 明 ， 带 来 了 新 的 学 科 : 计算 机 科学 。 如 同 其 他 任何 学 科 一 样 ， 计 算 机 科 
学 现在 被 划分 成 几 个 领域 。 我 们 可 以 把 这 些 领 域 归纳 为 两 大 类 : 系统 领域 和 应 用 领域 。 系 统 
领域 涵盖 那些 与 硬件 和 软件 构成 直接 有 关 的 领域 ， 例 如 计算 机 体系 结构 、 计 算 机 网 络 、 安 全 
问题 、 操 作 系 统 、 算 法 、 程 序 设 计 语 言 以 及 软件 工程 。 应 用 领域 涵盖 了 与 计算 机 使 用 有 关 的 
领域 ,例如 数据 库 和 人 工 智 能 。 本 书 对 所 有 这 些 领域 采用 广度 优先 的 方式 介绍 。 学 完 本 书 之 
后 ， 读 者 应 该 有 足够 的 信息 来 选择 专业 方向 。 


1.7 课程 纲要 
在 本 章 之 后 ， 本 书 分 为 了 五 大 部 分 。 


1.7.1 第 一 部 分 : 数据 的 表示 与 运算 


该 部 分 包括 第 2、3 和 4 章 。 第 2 章 讨 论 了 数字 系统 ， 数 量 如 何 能 使 用 符号 来 表示 。 第 
3 章 讨论 了 不 同 的 数据 如 何 存储 在 计算 机 中 。 第 4 章 讨论 了 一 些 基本 的 位 运算 。 


1.7.2 第 二 部 分 : 计算 机 硬件 


这 部 分 包含 第 5、6 章 。 第 5 章 给 出 计算 机 硬件 的 通用 概念 ， 讨 论 了 不 同 的 计算 机 组 成 。 
第 6 章 阑 明了 不 同 的 单个 计算 机 是 如 何 连接 成 计算 机 网 络 以 及 互联 网 的 。 本 章 还 特别 涉及 了 
与 互联 网 及 其 应 用 有 关 的 话题 。 


1.7.3 第 三 部 分 : 计算 机 软件 


这 部 分 包含 第 7、8、9 和 10 章 。 第 7 章 讨 论 了 操作 系统 ， 一 种 用 户 〈( 人 或 者 应 用 程序 ) 
用 来 控制 硬件 访问 的 系统 软件 。 第 8 章 说 明了 问题 求解 是 如 何 归结 成 为 该 问题 编写 算法 。 
第 9 章 是 当今 程序 设计 语言 之 旅 。 最 后 ， 第 10 章 是 软件 工程 的 概述 ， 这 是 软件 开发 的 工程 
方法 。 


1.7.4 ”第 四 部 分 : 数据 组 织 与 抽象 


这 部 分 是 对 第 一 部 分 的 补充 。 在 计算 机 科学 中 ， 原 子 数据 汇集 成 记录 、 文 件 和 数据 
库 。 数 据 抽象 使 得 程序 员 能 创建 关于 数据 的 抽象 观念 。 第 四 部 分 包含 第 11、12、13 和 14 
章 。 第 11 章 讨论 数据 结构 ， 即 集合 相同 或 不 同类 型 的 数据 到 一 个 类 属 中 。 第 12 章 讨论 抽 
象 数 据 类 型 。 第 13 章 说 明 不 同文 件 结构 是 如 何 能 够 用 于 不 同 的 目的 。 最 后 ， 第 14 章 讨论 
数据 库 。 
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1.7.5 ”第 五 部 分 : 高 级 话题 


第 五 部 分 给 出 了 高 级 话题 的 概要 ， 这 些 话题 是 计算 机 科学 专业 学 生 在 今后 的 教育 中 会 遇 
到 的 。 这 部 分 包含 第 15、16、17 和 18 章 。 第 15 章 讨 论 了 数据 压缩 ， 这 在 今天 的 数据 通信 
中 很 普遍 。 第 16 章 探 索 与 安全 有 关 的 问题 ， 当 我 们 通过 不 安全 的 信道 通信 时 ， 安 全 问题 变 
得 越 来 越 重要 。 第 17 章 讨论 计算 理论 ， 即 哪些 是 可 计算 的 ， 哪 些 是 不 可 计算 的 。 最 后 ， 第 
18 章 给 出 一 些 人 工 智能 的 观点 ， 在 计算 机 科学 中 , .这 是 一 个 日 益 受 到 挑战 的 话题 。 


1.8， 章 未 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
© Schneider, G. M. and Gersting, J. L. Invitation to Computer Science, Boston, MA: 
Course Technology, 2044 
® Dale, N. and Lewis, J. Computer Science llluminated, Sudbury, MA: Jones and Bartlett, 
2004 
@ Patt, Y. and Patel, S. Introduction to Computing Systems, New York: McGraw-Hill, 2004 


。 阿兰 . 图 灵 在 1937 年 首次 提出 了 一 个 通用 的 计算 设备 的 设想 。 他 设想 所 有 的 计算 都 
可 能 在 一 种 特殊 的 机 器 上 执行 ， 这 就 是 现在 所 说 的 图 灵机 。 

e 基于 冯 . 诺 依 曼 模型 建造 的 计算 机 分 为 4 个 子 系统 : 存储 器 、 算 术 逮 辑 单 元 、 控 制 

单元 和 输入 /输出 单元 。 冯 “' 诺 依 曼 模 型 指出 程序 必须 存储 在 存储 器 中 。 

我 们 可 以 认为 计算 机 由 三 大 部 分 组 成 : 计算 机 硬件 、 数 据 和 计算 机 软件 。 

e 计算 和 计算 机 的 历史 可 分 为 三 个 阶段 :机 械 计算 机 器 阶段 (1930 年 以 前 ); 电子 计算 

机 阶段 (1930 一 1950 年 ); 以 及 包括 5 个 现代 计算 机 时 代 的 阶段 。 

计算 机 科学 引发 了 一 些 周遭 的 问题 。 其 中 最 为 普遍 的 可 以 归 类 为 社会 问题 和 道德 

问题 。 

e 随 着 计算 机 的 发 明 ， 带 来 了 新 的 学 科 : 计算 机 科学 。 如 同 其 他 任何 学 科 一 样 ， 计 算 
机 科学 现在 被 划分 成 几 个 领域 。 


1.9 练习 
小 测验 
在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 测验 题 。 强 烈 建 议 学 生 在 继续 本 章 习题 前 首 
先 完 成 相关 测验 题 以 检测 对 本 材料 的 理解 。 
复习 题 


1. 定义 一 个 基于 图 灵 模 型 的 计算 机 。 

2. 定义 一 个 基于 冯 “' 诺 依 曼 模 型 的 计算 机 。 

3. 在 基于 图 灵 模 型 的 计算 机 中 ， 程 序 的 作用 是 什么 ? 

4. 在 基于 汉 “' 诺 依 曼 模 型 的 计算 机 中 ， 程 序 的 作用 是 什么 ? 


5. 计算 机 中 有 哪些 子 系统 ? 

6. 计算 机 中 存储 器 子 系统 的 功能 是 什么 ? 

7. 计算 机 中 ALU 子 系统 的 功能 是 什么 ? 

8. 计算 机 中 控制 单元 子 系统 的 功能 是 什么 ? 
9. 计算 机 中 输入 / 输出 子 系统 的 功能 是 什么 ? 
10. 简 述 5 个 时 代 的 计算 机 。 


练习 题 


1. 解释 为 什么 计算 机 不 能 解决 那些 计算 机 外 部 世界 无 解决 方法 的 问题 。 

2. 如 果 一 台 小 的 便宜 的 计算 机 可 以 做 大 型 昂贵 的 计算 机 同样 能 做 的 事情 ， 为 什么 人 们 需要 大 的 呢 ? 
3. 研究 Pascaline 计算 器 ， 看 看 它 是 否 符合 图 灵 模 型 。 

4. 研究 莱 布 尼 茨 之 轮 (Leibnitz's Wheel)， 看 看 它 是 否 符合 图 灵 模 型 。 

5. 研究 雅 卡尔 提花 织 机 (Jacquard loom)， 看 看 它 是 否 符合 图 灵 模 型 。 

6. 研究 查尔斯 巴 比 奇 分析 引 擎 ， 看 看 它 是 否 符合 冯 “ 诺 依 曼 模型 。 

7. 研究 ABC 计算 机 ， 看 看 它 是 否 符 合 汉 “' 诺 依 曼 模型 。 

8. 研究 并 找 出 键盘 起 源 于 哪 一 代 计算 机 。 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通 过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨论 材料 的 理解 。 
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数字 系统 





本 章 是 第 3、4 章 的 先导 。 在 第 3 章 中 我 们 将 说 明 数 据 是 如 何 存储 在 计算 机 中 的 。 在 第 
4 章 ， 我 们 讲解 逻辑 和 算术 运算 是 如 何 作用 于 数据 的 。 本 章 是 为 第 3、4 章 的 内 容 做 准备 。 
了 解数 字 系 统 的 读者 可 以 跳 过 本 章 转 到 第 3 章 ， 而 不 影响 连贯 性 。 注 意 本 章 所 讨论 的 数字 系 
统 是 “ 纸 和 笔 的 代表 物 ”: 第 3 章 讲解 这 些 数字 如 何 存储 在 计算 机 中 。 
目标 
通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 
。 理解 数字 系统 的 概念 ; 
分 清 非 位 置 化 和 位 置 化 数字 系统 ; 
描述 十 进 制 系统 〈 以 10 为 底 ); 
描述 二 进 制 系统 (以 2 为 底 ); 
描述 十 六 进 制 系统 (以 16 为 底 ); 
描述 八进制 系统 (以 8 为 底 ); 
将 二 进 制 、 八 进 制 或 十 六 进 制 数 字 转 换 为 十 进 制 系统 ; 
将 十 进 制 数字 转换 为 二 进 制 、 八 进 制 或 十 六 进 制 系统 ; 
将 二 进 制 和 八进制 数字 相互 转换 ; 
将 二 进 制 和 十 六 进 制 数字 相互 转换 ; 
e 查找 在 各 种 系统 中 代表 特定 数值 所 需 的 数码 。 


2.1 引言 


数字 系统 (或 数码 系统 ) 定义 了 如 何 用 独特 的 符号 来 表示 一 个 数字 。 在 不 同 的 系统 中 ， 
一 个 数字 有 不 同 的 表示 方法 。 例 如 ， 这 两 个 数字 (2A)ik 和 (52)s 都 是 指 同样 的 数量 (42)io， 但 是 
他 们 的 表示 截然 不 同 。 这 就 如 同 使 用 法 语 单词 cheval 和 拉丁 语 单词 equus 来 指称 同一 个 实体 
“到 ”一 样 。 

正如 我 们 在 语言 中 使 用 符号 (字符 ) 来 创建 单词 一 样 ， 我 们 使 用 符号 (数码 ) 来 表示 数 
字 。 但 是 ， 我 们 知道 在 任何 语言 中 的 符号 (字符 ) 数量 都 是 有 限 的 。 我 们 需要 重复 并 组 合 它 
们 来 创建 单词 。 数 字 也 是 一 样 : 我 们 使 用 有 限 的 数字 符号 (数码) 来 表示 数字 ， 这 意味 着 数 
码 需 要 重复 使 用 。 

一 些 数字 系统 已 经 在 过 去 广 为 使 用 ， 并 可 以 分 为 两 类 : 位 置 化 系统 和 非 位 置 化 系统 。 我 
们 的 主要 目标 是 讨论 位 置 化 数字 系统 ， 但 也 给 出 非 位 置 化 系统 的 例子 。 


2.2 位置 化 数字 系统 


在 位 置 化 数字 系统 中 ,数字 中 符号 所 占据 的 位 置 决定 了 其 表示 的 值 。 在 该 系统 中 ， 数 字 
这 样 表示 : 
+ (Sk-1**S2S1S0. 9-19-2…9-D5 
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它 的 值 是 : 
n=+ Se1 Xbtlt. +8 x bitS x b+ Sxb tS xb + xb 
其 中 ,5 是 一 套 符号 集 ; b 是 底 (或 基数 )， 它 等 于 5S 符号 集中 的 符号 总 数 ， 其 中 S51 和 Si 是 
代表 分 数 部 分 或 整个 数字 的 符号 。 注 意 我 们 使 用 的 表达 式 可 以 从 右边 或 从 左边 扩展 。 也 就 是 
说 ,b 的 罕 可 以 从 一 个 方向 由 0 到 k-1， 还 可 以 从 另 一 个 方向 由 -1 到 -i。 2 的 非 负数 宕 与 该 
数字 的 整数 部 分 有 关 ， 而 负数 宕 与 该 数字 的 小 数 部 分 有 关 。+ 符号 表示 该 数字 可 正 可 负 。 本 
章 我 们 将 学 习 一 些 位 置 化 数字 系统 。 


2.2.1 十 进 制 系统 (以 10 为 底 ) 


本 章 首先 讨论 的 位 置 化 数字 系统 是 十 进 制 系统 。decimal (十 进 制 ) 来 源 于 拉丁 词根 
decem (十 )。 在 该 系统 中 ， 底 b=10 并 且 我 们 用 10 个 符号 来 表示 一 个 数 。 符 号 集 是 5S ={0， 
1，2，3，4，5，6，7，8，9}。 正 如 我 们 所 知 ， 该 系统 中 的 符号 常 被 称 为 十 进 制 数码 或 仅 称 
为 数码 。 本 章 中 ,我们 使 用 + 符号 表示 一 个 数 可 正 可 负 ， 但 记 住 这 些 符号 并 不 存储 在 计算 
机 中 一 一 计算 机 用 以 处 理 该 符号 的 方式 不 同 ， 如 第 3 章 中 讨论 的 那样 。 

计算 机 存储 正 负数 的 方式 不 同 。 

在 十 进 制 系统 中 ， 数 字 写 为 : 

士 (SS29190. $1S 2°*°S1)1o 

但 是 为 了 简便 ， 我 们 通常 省 略 圆 括号 、 底 和 正 号 (对 于 正 数 )。 例 如 ， 我 们 把 +(552.23)10 
写成 552.23， 底 和 加 号 是 隐 含 的 。 

1. 整数 

在 十 进 制 系统 中 ， 整 数 (没有 小 数 部 分 的 整 型 数字 ) 是 我 们 所 熟悉 的 ， 我 们 在 日 常生 活 中 使 
用 整数 。 实 际 上 ， 我 们 使 用 它 已 经 习以为常 。 我 们 把 整数 表示 为 + Si1…52S1S6o， 其 值 计算 为 : 

N=+ St x 10%!+Se> x 10 十 9 x 102+S1 x 10!+.S° x 109 
其 中 ，&% 是 1 个 数码 ，b=10 是 底 , 是 数码 的 数量 。 

另 一 种 在 数字 系统 中 显示 一 个 整数 的 方法 是 使 用 位 置 量 ， 即 用 10 的 究 (10"，10!:，… 

10“' ) 表示 十 进 制 数字 。 图 2-1 显示 了 在 十 进 制 系统 中 使 用 位 置 量 表示 一 个 整数 。 
10*-! 10e ea。 10? 10! 10"。 ”位 置 量 








| | | 由 } 
N= 土 S x 108F! 十 S$, ,x 10:? + eee + 5, x102 + S, xl10! 十 x10° 值 
图 2-1 在 十 进 制 系统 中 使 用 位 置 量 表示 整数 


例 2.1 以 下 显示 了 在 十 进 制 系统 中 使 用 位 置 量 表示 整数 +224。 
10” 10: 10° 位 置 量 
2 De 4 数字 
N=+ 2x10: + 2x10' + 4x10° 值 
注意 ， 在 位 置 1 的 数码 2 值 为 20, 但 是 在 位 置 2 的 同一 个 数码 其 值 为 200。 还 要 注意 通 
常 我 们 省 略 掉 的 加 号 ， 实 际 上 是 隐 含 的 。 
例 2.2 以 下 显示 了 在 十 进 制 系统 中 使 用 位 置 量 表示 整数 -7508。 我 们 已 经 使 用 1，10 
100 和 1000 来 代替 10 的 寡 。 


14 和 锚 2 匡 


1000 100 10 1 位 置 量 
7 5 0- 8 数字 
N=- CCxl000 + 5x100 + Ox10 + 8x!1) 值 


最 大 值 
有 时 我 们 需要 知道 可 以 用 数码 表示 的 十 进 制 整数 的 最 大 值 。 答 案 是 Nas=10 二 1。 例 
如 ， 如 果 k=5， 那 么 这 个 最 大 值 就 是 Naax=10:-1=99 999。 
2. 实数 
在 十 进 制 系统 中 ， 实 数 ( 带 有 小 数 部 分 的 数字 ) 也 是 我 们 所 熟悉 的 。 例 如 ， 使 用 该 系统 
来 表示 元 和 分 ($23.40 ) 整数 。 我 们 可 以 把 实数 表示 为 上 Se…SiSo. SS， 其 值 计 算 为 : 
整数 部 分 小 数 部 分 
R=+S x10°1++S x 10'+S0x10° + Six10+..+S,x 107 
其 中 ，5S' 是 1 个 数码 ，b=10 是 底 , 大 是 整数 部 分 数码 的 数量 ，! 是 小 数 部 分 数码 的 数量 。 
十 进 制 小 数 点 是 我 们 用 于 分 割 整数 部 分 和 小 数 部 分 的 。 
例 2.3 以 下 显示 了 实数 +24.13 的 位 置 量 。 
10! 10° 107! 107 位 置 量 
2 4 . 1 3 数字 
R=+ 2x10 + 4xl + 1x0.1 + 3x0.01 值 


2.2.2 ”二进制 系统 (以 2 为 底 ) 


我 们 在 本 章 中 讨论 的 第 二 种 位 置 化 数字 系统 是 二 进 制 系统 。binary (二 进 制 ) 来 源 于 拉 
丁 词根 bini (二 )。 在 该 系统 中 ， 底 b=2 并 且 我 们 用 两 个 符号 来 表示 一 个 数 ， 即 S={0，1}。 
该 系统 中 的 符号 常 被 称 为 二 进 制 数码 或 位 (位 数码 )。 如 我 们 将 要 在 第 3 章 看 到 的 ， 数 据 和 
程序 是 以 二 进 制 模式 (即位 串 )， 存 储 于 计算 机 中 的 。 这 是 因为 计算 机 由 电子 开关 制 成 ， 它 
们 仅 有 开 和 关 两 种 状态 。1 位 表示 这 两 种 状态 之 一 ，0 位 表示 另 一 种 状态 。 

1. 整数 

我 们 可 以 把 整数 表示 为 + (Si…5150);:， 其 值 计 算 为 : 

N= + Sx 2+ Se X22++ $2 x 22+51 x 2'+50 x 2° 

其 中 ，5; 是 1 个 数码 ，b=2 是 底 , 是 数码 的 数量 。 

另 一 种 表示 二 进 制 数 的 方法 是 使 用 位 置 量 (2"，2'，…，21 ) 。 图 2-2 显示 了 在 二 进 制 
系统 中 使 用 位 置 量 表示 一 个 数 。 
2 和 2 和 。。。 2 2! 2 ”位置 量 

se Si S | 数字 
| 站 由 
N=t+tS ix2cr +S ax2r2 +eee + 5x2 + Sx2 + 5S,x2 值 
图 2-2 在 二 进 制 系统 中 使 用 位 置 量 表示 整数 


例 2.4 以 下 显示 了 与 十 进 制 数 25 等 值 的 二 进 制 数 (11001),。 下 标 2 表示 底 是 2。 
24 2 2 2! 2° 位 置 量 
1 1 0 0 1 数字 

N= + 1x2 + 1x2 + 0x2 + 0x2 + 1x2” 值 
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注意 ， 相 等 的 十 进 制 数 为 N=16+8+0+0+1=25。 

最 大 值 

数码 表示 的 二 进 制 整 数 的 最 大 值 是 Nasx=2“-1。 例 如 ， 如 果 k=5， 那 么 这 个 最 大 值 就 
是 Nmax=25-1=31。 

2. 实数 

在 二 进 制 系统 中 ， 一 个 实数 (可 带 有 小 数 部 分 的 数字 ) 可 以 由 左边 的 位 和 右边 的 1 位 
组 成 ， 士 (SS190 SS， 其 值 计 算 为 : 

整数 部 分 小 数 部 分 
R=+ Ste1X2 ttS XHS0X2 + SIX2 tS x27 

其 中 ，S; 是 1 个 位 ，b=2 是 底 , 左 是 小 数 点 左边 位 的 数量 ，! 是 小 数 点 右边 位 的 数量 。 注 意 
从 0 开始 ,而 /从 -1 开始 。 最 高 的 寡 是 二 1 且 最 低 的 寡 是 -1。 

例 2.5 “村 下 是 款 开 与 十 进 制 数 5.75 等 值 的 一 进 制 数 (101.11)2。 
8  ， 位 置 量 
数字 
文 2 + “本 值 
注意 ， 相等 的 十 进 制 数 为 R- 4+0+1+0.5+0.25= 5.75。 


2.2.3 十 六 进 制 系统 (以 16 为 底 ) 


尽管 二 进 制 系统 用 于 存储 计算 机 数据 ,但 是 它 并 不 便于 在 计算 机 外 部 表示 数字 ， 因 为 与 
十 进 制 符号 相 比 ， 二 进 制 符号 过 长 。 然 而 ， 十 进 制 不 像 二 进 制 那样 直接 显示 存储 在 计算 机 中 
的 是 什么 。 在 二 进 制 位 数 和 十 进 制 数字 之 间 没 有 显然 的 关系 。 正 如 我 们 看 到 的 那样 ， 它 们 之 
间 的 转换 也 不 快捷 。 

为 了 克服 这 个 问题 ， 发 明了 两 种 位 置 化 系统 : 十 六 进 制 和 八进制 。 我 们 先 讨 论 更 常用 的 
十 六 进 制 系统 。hexadecimal (十 六 进 制 ) 来 源 于 希腊 词根 hex (六 ) 和 拉丁 词根 decem (十 )。 
为 了 和 十 进 制 与 二 进 制 一 致 ， 它 应 该 称 作 sexadecimal， 根 据 拉丁 词根 sx 和 decem。 在 该 系 
统 中 ， 底 b=16 并 且 用 16 个 符号 来 表示 一 个 数 。 字 符 集 是 S={0，1，2，3，4，5，6，7，8， 
9，A，B，C，D，E, F}。 注 意 符号 A，B，,，C，D,，, E, F (大 写 或 小 写 ) 分 别 等 于 10，11， 
12，13，14 和 15。 该 系统 中 的 符号 常 被 称 为 十 六 进 制 数码 。 

1. 整数 

我 们 可 以 把 整数 表示 为 + Si1…S15o， 其 值 计算 为 : 

N=+St1x16° + So X16 ?+...+62 x 162+S1 x 161+Sox 16° 

其 中 ，5; 是 1 个 数码 ，b=16 是 底 ， 是 数码 的 数量 。 

另 一 种 表示 十 六 进 制 数 的 方法 是 使 用 位 置 量 (16"，16!，…，16“1)。 图 2-3 显示 了 在 
十 六 进 制 系统 中 使 用 位 置 量 表示 一 个 数 。 








16"! 16"? 。。 16’ 16' 16 ”位 置 量 
土 | Sui Se e000 3 Si So 数字 
N= +S,1x16" + Sexl1652 + 。。 + 5S,x16 + Six16 + Sox16? 值 


图 2-3 在 十 六 进 制 系统 中 使 用 位 置 量 表示 整数 


16 有 2 募 


例 .2.6 与 十 进 制 数 686 等 值 的 十 六 进 制 数 (2AE)16。 





16! 16" 位 置 量 
AR E 数字 
N= + + 10x16' + 4x16° 值 
最 大 值 


数码 表示 的 十 六 进 制 整 数 的 最 大 值 是 Nosx=16 和 -1。 例 如 ， 如 果 k=5， 那 么 这 个 最 大 值 
就 是 Nmax=165-1=1 048 575。 

2. 实数 

尽管 一 个 实数 可 以 用 十 六 进 制 系统 表示 ， 但 并 不 常见 。 


2.2.4 八进制 系统 (以 8 为 底 ) 


人 们 发 明 的 与 二 进 制 系统 等 价 并 用 于 计算 机 外 部 的 第 二 种 系统 是 八进制 系统 。octal ( 八 
进 制 ) 来 源 于 拉丁 词根 octo( 八 )。 在 该 系统 中 ， 底 b=8 并 且 用 8 个 符号 来 表示 一 个 数 。 字 
符 集 是 S={0，1，2，3，4，5，6，7}。 该 系统 中 的 符号 常 被 称 为 八进制 数码 。 

1. 整数 

我 们 可 以 把 整数 表示 为 + Si1…51S。， 其 值 计算 为 : 

N= 士 Sk_1X SS 2 x :二 . 
其 中 ，&8 是 1 个 数码 ，b=8 是 底 ， 是 数码 的 数量 。 

另 一 种 表示 八进制 数 的 方法 是 使 用 位 置 量 (8"，8!，…，8“)。 图 2-4 显示 了 在 八进制 

系统 中 使 用 位 置 量 表示 一 个 数 。 。 





gel 8 。 8: 8: 8? ”位 置 量 
+| Se Se i S$ Qi So | 数字 
| | | 


N= +tSLx8rl +S xs8sc + eee + Sx8 + Sx8 + Sx8 值 
图 2-4 在 八进制 系统 中 使 用 位 置 量 表示 整数 
例 2.7 六 Js 686 人 全 各 


N=+ 

注意 ， 相等 的 十 进 制 数 为 N=512+128+40+6= 686。 

最 大 值 

数码 大 表示 的 八进制 整数 的 最 大 值 是 News=8 熏 1。 例如， 如 果 =5， 那 么 这 个 最 大 值 就 
是 Nmax=85-1=32 767。 

2. 实数 

尽管 一 个 实数 可 以 用 八进制 系统 表示 ， 但 并 不 常见 


2.2.5 4 种 位 置 化 数字 系统 的 小 结 
表 2-1 是 本 章 讨论 的 4 种 位 置 化 数字 系统 的 小 结 。 
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表 2-1 4 种 位 置 化 数字 系统 的 小 结 


er new 
nn | 
I | 
eC 
| 










2345.56 






(1001.11 ) > 








(156.23 ) 






十 六 进 制 0，1，2，3，4，5，6，7，8，9，A，B，C，D，E，F (A2C.A1) i6 


表 2-2 显示 了 数字 15 在 十 进 制 中 使 用 2 个 数码 ， 在 二 进 制 中 使 用 4 个 数码 ， 在 
八进制 中 使 用 2 个 数码 ， 在 十 六 进 制 中 仅仅 使 用 1 个 数码 。 十 六 进 制 表示 法 显然 是 最 
短 的 。 


表 2-2 4 种 位 置 化 数字 系统 中 的 数字 比较 





2.2.6 ”转换 


我 们 需要 知道 如 何 将 一 个 系统 中 的 数字 转换 到 另 一 个 系统 中 的 等 价 的 数字 。 鉴 于 
我 们 更 熟悉 十 进 制 系统 ， 先 讲解 如 何 从 其 他 进 制 转换 到 十 进 制 。 接 着 讲解 如 何 从 十 进 
制 转换 到 其 他 进 制 。 最 后 讲解 如 何 简便 地 进行 二 进 制 与 八进制 或 十 六 进 制 之 间 的 互相 
转换 。 

1. 其 他 进 制 到 十 进 制 的 转换 

这 种 转换 是 简单 而 迅速 的 。 我 们 将 数码 乘 以 其 在 源 系统 中 的 位 置 量 并 求 和 便 得 到 在 十 进 
制 中 的 数 。 思 路 显示 在 图 2-5 中 。 


十 进 制 点 
E [Ls] ! 国 国 | … -~ 
pb"! b! bp 2 Be es bp” 位 置 量 
Si xXb ltoeet+ Sxb+Sxb + Sxbp'+S,xb?*+ 。……。+S,xb' 乘 





| 整数 | 十 进 制 


图 2-5 任意 进 制 到 十 进 制 的 转换 
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例 2.8 下 面 显示 如 何 将 二 进 制 数 (110.11)? 转换 为 十 进 制 数 6.75。 
二 进 制 1 1 0 . 1 1 

位 置 量 22 2! 2° 2 27 

各 部 分 结果 4 + 2 + 0 + 0.5 + 0.25 


十 进 制 : 6.75 

例 2.9 下 面 显示 如 何 将 十 六 进 制 数 (1A.23)i6 转换 为 十 进 制 数 。 
十 六 进 制 1 ns 3 

位 置 量 16! 16° 167 167 

各 部 分 结果 16 + 10 + 0.125 + 0.012 

十 进 制 : 26.137 


注意 这 个 十 进 制 表示 并 不 精确 ， 因 为 3x16-?=0.01 171 875。 四 舍 五 人 成 3 位 小 数 
(0.012 )， 也 就 是 说 ，3 x 16” = 0.012。 数 字 转 换 时 我 们 需要 指明 人 允许 保留 几 位 小 数 。 

例 2.10 下 面 显示 如 何 将 八进制 数 (23.17)s 转换 为 十 进 制 数 。 

八进制 wn 人 注 

位 置 量 8 8° 8 

各 部 分 结果 16 + 3 + 0.125 + 0.109 

十 进 制 : 19.234 

在 十 进 制 中 (23.17)s 、 19.234。 再 一 次 ， 我 们 把 7 x 8 “= 0.109 375 四 舍 五 和信。 

2. 十 进 制 到 其 他 进 制 的 转换 

我 们 能 够 将 十 进 制 数 转换 到 与 其 等 值 的 其 他 进 制 。 需 要 两 个 过 程 ， 一 个 用 于 整数 部 分 ， 
另 一 个 用 于 小 数 部 分 。 

(1 ) 转换 整数 部 分 

整数 部 分 的 转换 可 使 用 连 除 。 图 2-6 显示 了 该 过 程 的 UML 图 。 我 们 在 整 本 书 中 使 用 
UML 图 。 对 于 不 熟悉 UML 图 的 读者 可 以 阅读 附录 B。 





开始 






源 : 十 进 制 数 的 整数 部 分 
目标 : 转换 后 的 整数 部 分 
底 : 目标 底 


条 件 : 商 为 0 


图 2-6 转换 整数 部 分 的 算法 


我 们 称 十 进 制 数 的 整数 部 分 为 源 ， 转 换 后 的 整数 部 分 为 目标 。 我 们 先 创 建 一 个 空 目标 。 
接着 反复 除 源 并 得 到 商 和 余数 。 余 数 插入 目标 的 左边 ， 商 变 为 新 的 源 。 图 2-7 显示 了 在 每 次 
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重复 中 如 何 得 到 商 。 

下 面 我 们 使 用 一 些 例 子 手工 演示 如 图 2-7 所 
示 的 过 程 。 

例 2.11 下 面 演示 如 何 将 十 进 制 数 35 转换 
为 二 进 制 数 。 我 们 从 这 个 十 进 制 数 开始 ， 一 边 连 
续 寻 找 除 以 2 得 到 的 商 和 余数 ， 一 边 左 移 。 结 果 
是 35=(100011)2。 





图 2-7 转换 十 进 制 的 整数 部 分 到 其 他 进 制 


87- 十 进 制 
i 
1 0 0 1 1 ”二进制 


例 2.12 下 面 演示 如 何 将 十 进 制 数 126 转换 为 八进制 数 。 我 们 一 边 连续 寻找 除 以 8 得 
到 的 商 和 余数 ， 一 边 左 移 。 结 果 是 126=(176)s。 
0 十 进 制 
! l ! 
1 一 7 < 一 “6 八进制 
例 2.13 下 面 演示 如 何 将 十 进 制 数 126 转换 为 十 六 进 制 数 。 我 们 一 边 连续 寻找 除 以 16 
得 到 的 商 和 余数 ， 一 边 左 移 。 结 果 是 126=(7E)16。 
TE + 
ll 
7 一 E 十 六 进 制 





(2 ) 转换 小 数 部 分 

小 数 部 分 的 转化 可 使 用 连 乘法 。 我 们 称 十 进 制 数 的 小 数 部 分 为 源 ， 转 换 后 的 小 数 部 分 的 
数 为 目标 。 我 们 先 创建 一 个 空 目标 。 接 着 反复 乘 源 并 得 到 结果 。 结 果 的 整数 部 分 插入 目标 的 
右边 ， 而 小 数 部 分 成 为 新 的 源 。 图 2-8 显示 了 该 过 程 的 UML 图 。 图 2-9 显示 了 在 每 次 重复 
中 如 何 得 到 目标 。 我 们 使 用 一 些 例子 手工 演示 如 图 2-9 所 示 的 过 程 。 


源 和 底 
创建 空 的 目标 
本 源 : 十 进 制 数 的 小 数 部 分 
用 底 乘 以 源 得 到 结果 | 目标 ， 转换 后 的 小 数 部 分 
条 件 : 小 数 部 分 为 0 或 目标 数位 足够 
插入 整数 部 分 到 
目标 的 右边 
结果 的 小 数 部 分 
变 为 新 的 源 


开始 









[条 件 为 真 ] 


图 2-8 ”转换 小 数 部 分 的 算法 
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例 2.14 将 十 进 制 数 0.625 转换 为 二 进 制 数 。 

解 ”因为 0.625 没有 整数 部 分 ， 该 例子 显 人 
示 小 数 部 分 如 何 计算 。 这 里 是 以 2 为 底 。 在 时 时 
左边 一 角 写 上 这 个 十 进 制 数 。 连 续 乘 2， 并 记 se 






录 结 果 的 整数 和 小 数 部 分 。 小 数 部 分 移 到 右 I D,: 目标 数码 

边 ， 整 数 部 分 写 在 每 次 运算 的 下 面 。 当 小 数 ”水 数 闲 不 为 0。 

部 分 为 0， 或 达到 足够 的 位 数 时 结束 。 结 果 是 。 当 创 建 了 足够 的 位 数 后 停止 。 

0.625=(0.101),。 图 2-9 转换 十 进 制 的 小 数 部 分 到 其 他 进 制 
十 进 制 一 025 一 050 

| ! 





二 进 制 。 


例 2.15 下 面 演示 如 何 将 0.634 转 换 为 八进制 数 且 精 确 到 4 位 小 数 结果 是 
0.634=(0.5044)s。 








十 进 制 一 WO 去 
! | 国 
- 进 制 ， 员 和 辐 汪 全 国 





例 2.16 下面 演 示 如 何 将 十 进 制 数 96.6 转 洲 为 十 夫 壕 市 数 是 精 询 到 1 位 小 数 。 结 果 是 
178.6=(B2.9)ie。 注 意 ， 以 16 为 底 时 除 或 乘 以 16。 
+ 进 制 国 轩 一 尘 几 一 06 一 “05 
4 由 
十 六 进 制 2 
例 2.17 把 小 的 十 进 制 数 (通常 小 于 256 ) 转换 为 二 进 制 数 有 一 个 变通 的 方法 ， 即 把 这 
个 数 分 解 为 下 列 二 进 制 位 置 量 对 应 数 的 和 。 





十 进 制 对 等 量 128 64 32 16 4 2 1 
使 用 该 表 可 以 转换 165 为 二 进 制 数 (10100101),， 如 下 所 示 : 
十 进 制 165 =128 +50 + 3 + 00+ 0 +4 + 0 + 


二 进 制 1 0 1 0 0 1 0 1 
例 2.18 当 分 母 是 2 的 寡 次 时 ， 用 类 似 的 方法 可 以 把 十 进 制 小 数 转换 为 二 进 制 。 
位 置 量 2 








十 进 制 对 等 量 内 hie Me 
使 用 该 表 可 以 转换 ”?/6 为 二 进 制 数 (0. 011011);, 
十 进 制 ”*7/6= J 十 十 1 








+ Me 
Jat+ Vs + Ys + We 
根据 十 进 制 对 等 的 值 排 列 这 些 分 数 。 注 意 ， 由 于 :2 和 Wie 缺失， 我 们 用 0 代替 。 
+ 进 制 "ua= 和 + 本 + 于 + 国 + 是 + 国 
二 进 制 0 1 1 0 1 1 
(3 ) 数码 的 数量 
在 把 数字 从 十 进 制 转换 到 其 他 进 制 之 前 ,我们 需要 知道 数码 的 数量 。 通 过 大 [ logsV | 
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的 关系 ， 我 们 总 可 以 找到 一 个 整数 的 数码 的 数量 ， 其 中 [x] 意 味 着 最 小 的 整数 大 于 或 等 于 x 
(这 也 称 为 x 的 高 限 )，N 是 该 整数 的 十 进 制 值 。 例 如 ， 我 们 可 以 找到 十 进 制 数 234 在 所 有 4 
个 系统 中 的 位 数 ， 如 下 所 示 : 

a. 十 进 制 : Ki=「 log10234 1]=『「 2.37 1=3， 显 而 易 见 。 

b. 二 进 制 : 有 =「 log2234 ]=『「 7.8 |]=8， 因 为 234 = (11101010)2， 所 以 正确 。 

c. 八进制 : =「 logs234 |=| 2.62]=3， 因 为 234 = (352)s， 所 以 正确 。 

d. 十 六 进 制 : =「 logie234 1=『「 1.96 1=2， 因 为 234 = (EA)i6。， 所 以 正确 。 

如 果 你 的 计算 器 不 包括 任意 底 的 对 数 运算 ， 参见 附录 G 关于 如 何 计算 logsN 的 信息 。 

3. 二 进 制 -十 六 进 制 的 转换 

我 们 能 轻松 将 数字 从 二 进 制 转换 到 十 六 进 制 ， 反 之 亦 然 。 这 是 因为 在 这 两 个 底 之 间 存 在 
一 种 关系 : 二 进 制 中 的 4 位 恰好 是 十 六 进 制 中 的 1 位 。 图 2-10 显示 了 该 转换 是 如 何 进行 的 。 


B,: 二 进 制 数码 (位) H,: 十 六 进 制 数码 


B, B.,1B, 2B. ;| .… |B，B。B，B, || B;，B，B，B。| 二 进 制 


十 六 进 制 
图 2-10 ”二进制 与 十 六 进 制 的 互 换 


例 2.19 下 面 演示 如 何 将 二 进 制 数 (10011100010): 转换 为 十 六 进 制 数 。 

解 ”我 们 先 将 二 进 制 数 排 为 4 位 一 组 的 形式 : 100 1110 0010。 注 意 最 左边 一 组 可 能 是 1 
到 4 位 不 等 。 我 们 根据 表 2-2 所 示 的 值 对 照 每 组 等 量 转换 得 到 十 六 进 制 数 (4E2)ie。 

例 2.20 与 十 六 进 制 数 (24C)i 相等 的 二 进 制 数 是 多 少 ? 

解 ” 将 每 个 十 六 进 制 数 码 转 换 成 4 位 一 组 的 二 进 制 数 : 2 一 0010,， 4 一 0100， 以 及 
C 一 1100。 该 结果 是 (001001001100);。 

4. 二 进 制 - 八进制 的 转换 

我 们 能 轻松 将 数字 从 二 进 制 转换 到 八进制 ， 反 之 亦 然 。 这 是 因为 在 这 两 个 底 之 间 存 在 一 
种 关系 : 二 进 制 中 的 3 位 恰好 是 八进制 中 的 1 位 。 图 2-11 显示 了 该 转换 是 如 何 进行 的 。 






B,: 二 进 制 数码 (位 ) O,: 八进制 数码 
-um 
八进制 


2-11 二 进 制 与 八进制 的 互 换 


例 2.21 下 面 演示 如 何 将 二 进 制 数 (101110010); 转换 为 八进制 数 。 

解 ” 每 3 位 一 组 转换 为 1 位 八进制 数码 。 根 据 表 2-2 所 示 的 值 对 照 每 3 位 一 组 等 量 转换 
得 到 八进制 数 结果 是 (562)s。 

例 2.22 与 (24)s 相等 的 二 进 制 数 是 多 少 ? 

解 ” 将 每 个 八进制 数码 写成 对 等 的 二 进 制 位 组 ， 得 到 (010100):。 

5. 八进制 -十 六 进 制 的 转换 

将 数字 从 八进制 转换 到 十 六 进 制 并 不 难 ， 反 之 亦 然 。 我 们 可 以 使 用 二 进 制 系统 作为 中 介 
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系统 。 图 2-12 显示 了 一 个 例子 。 
该 步骤 如 下 : 
e@ 从 八进制 转 到 十 六 进 制 ， 我 们 先 将 八 进 6 一] 八进制 
制 转 到 二 进 制 。 我 们 将 位 数 重 排 成 4 位 
一 组 ， 找 到 十 六 进 制 的 对 等 值 。 
e 从 十 六 进 制 转 到 八进制 ， 我们 先 将 十 六 
进 制 转 到 二 进 制 。 我 们 将 位 数 重 排 成 3 
位 一 组 ， 找 到 八进制 的 对 等 值 。 
数码 的 数量 
从 一 个 底 向 另 一 个 转换 中 ， 如 果 我 们 知道 源 系统 数码 的 最 大 数量 ， 就 能 知道 我 们 在 目标 
系统 中 所 需 用 到 的 数码 的 最 小 数量 。 例 如 ， 如 果 在 源 系统 中 我 们 知道 最 多 使 用 6 个 十 进 制 数 
码 ， 那 么 在 目标 系统 中 我 们 就 知道 要 使 用 二 进 制 数 码 的 最 少数 量 。 通 常 ， 假 设 在 以 包 为 底 
和 
大 数 是 bY-1。 因 此 bw-1 宇 b/:-1。 这 意味 着 by 二 : 
x 宇 kX(log bi/ log oo) 或 六 a bylogb) | 
例 2.23 找 出 二 进 制 数码 的 最 小 数 ， 用 于 存储 一 个 最 大 6 个 数码 的 十 进 制 整数 。 
解 k 磋 6, bi=10,， b=2,， 且 x= [kX(log bi/ log b;) 1]=『6x(1/0.30 103) ]=20。 最 大 的 6 
数码 十 进 制 数 是 999 999， 并 且 最 大 的 20 位 二 进 制 数 是 1 048 575。 注 意 ， 可 以 用 19 位 表示 
的 最 大 的 数 是 524 287， 它 比 999 999 小 。 因 此 我 们 肯定 需要 20 位 。 


2.3” 非 位 置 化 数字 系统 


尽管 非 位 置 化 数字 系统 并 不 用 在 计算 机 中 ， 但 我 们 给 出 简单 的 介绍 作为 和 位 置 化 数字 系 
统 的 比较 。 非 位 置 化 数字 系统 仍然 使 用 有 限 的 数字 符号 ， 每 个 符号 有 一 个 值 。 但 是 符号 所 占 
用 的 位 置 通常 与 其 值 无 关 一 一 每 个 符号 的 值 是 固定 的 。 为 求 出 该 数字 的 值 ， 我 们 把 所 有 符号 
表示 的 值 相 加 。 该 系统 数字 表示 为 : 

911929190。 3_19_2…S- 














图 2-12 八进制 与 十 六 进 制 的 互 换 





并 有 值 为 : 
整数 部 分 小 数 部 分 
n= tit' tS 60 + STS tHS 
与 前 面 提 到 的 相 加 规则 有 一 些 例 外 ， 如 例 2.24 所 示 。 
例 2.24 罗马 数字 系统 是 非 位 置 化 数字 系统 的 一 个 好 例子 。 该 系统 由 罗马 人 发 明 ， 并 
在 欧洲 一 直 使 用 到 16 世纪 。 它 仍 在 体育 比赛 、 钟 表 刻 度 和 其 他 应 用 中 使 用 。 该 数字 系统 有 
一 套 符号 S={T，V，X,，L，C，D，M)} ， 每 个 符号 的 取 值 如 表 2-3 所 示 。 


表 2-3 罗马 数字 系统 的 符号 取 值 
3 Tv I* I. Ts aa 
为 求 一 个 数 的 值 ， 我 们 需要 遵循 特定 的 法 则 将 符号 的 值 相 加 : 


1 ) 当 一 个 带 有 较 小 值 的 符号 位 于 一 个 带 有 同等 值 或 较 大 值 的 符号 的 后 面 ， 这 些 值 相 加 。 
2 ) 当 一 个 带 有 和 较 小 值 的 符号 位 于 一 个 带 有 较 大 值 的 符号 的 前 面 ， 用 大 值 减 小 值 。 
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3 ) 如 果 5S, 和 10XS， 则 符号 $S 不 能 出 现在 符号 5S, 之 前 。 例 如, I 和 V 不 能 出 现在 C 


前 面 。 


4 ) 对 于 大 数字 , 在 6 种 符号 ( 除 I 以 外 的 所 有 符号 ) 中 的 任意 一 个 上 方 加 横 杠 表示 乘 以 
1000。 例 如 ，V=5000 和 M=1 000 000。 
5 ) 尽管 罗马 人 使 用 单词 nulla ( 空 ) 来 表达 零 的 概念 ， 但 罗马 数字 在 其 系统 中 缺少 数 





码 0。 
下 面 显示 了 一 些 罗马 数字 和 它们 的 值 : 
亚 一 1+1+1 = 3 
V 一 5-l = 4 
三 -一 5+1+1+1 = 8 
-地 10+5+1+1+1 二 18 
一 10+(10-1) = 19 | 
= S0+10+10+1+1 = 72 
下 100+1 = 101 
一 1000+1000+5+1+1 = 2007 
一 1000+500+100 = 1600 
2.4 章 末 材料 
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Null, L. and Lobur, J. Computer Organization and Architecture, Sudbury, MA: Jones 
and Bartlett, 2003 

Brown, S$. and Vranesic, Z. Fundamentals of Digital Logic with Verilog Design, New 
York: McGraw-Hill, 2003 


数字 系统 (或 数码 系统 ) 是 用 独特 的 符号 来 表示 一 个 数字 的 系统 。 位 置 化 数字 系统 
中 ， 在 数字 中 符号 所 占据 的 位 置 决 定 了 其 表示 的 值 。 每 个 位 置 有 一 个 位 置 量 与 其 相 
关联 。 非 位 置 化 数字 系统 使 用 有 限 的 数字 符号 ， 每 个 符号 有 一 个 值 。 但 是 符号 所 占 
用 的 位 置 通常 与 其 值 无 关 ， 每 个 符号 的 值 是 固定 的 。 

在 十 进 制 系统 中 ， 底 b=10 并 且 我 们 用 10 个 符号 来 表示 一 个 数 。 该 系统 中 的 符号 
常 被 称 为 十 进 制 数码 或 仅 称 为 数码 。 在 二 进 制 系统 中 ， 底 b=2 并 且 我 们 用 2 个 符号 
来 表示 一 个 数 。 该 系统 中 的 符号 常 被 称 为 二 进 制 数码 或 位 。 在 十 六 进 制 系统 中 ， 底 
b=16 并 且 我 们 用 16 个 符号 来 表示 一 个 数 。 该 系统 中 的 符号 常 被 称 为 十 六 进 制 数码 。 
在 八进制 系统 中 ， 底 b=8 并 且 我 们 用 8 个 符号 来 表示 一 个 数 。 该 系统 中 的 符号 常 被 
称 为 八进制 数码 。 

我 们 可 以 从 任意 进 制 转换 到 十 进 制 。 我 们 将 数码 乘 以 其 在 源 系统 中 的 位 置 量 并 求 和 
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便 得 到 在 十 进 制 中 的 数 。 我 们 能 够 将 十 进 制 数 转换 到 与 其 等 值 的 任意 进 制 数 。 需 要 
两 个 过 程 ， 一 个 用 于 整数 部 分 ， 另 一 个 用 于 小 数 部 分 。 整 数 部 分 需要 连 除 ， 而 小 数 
e 将 数字 从 二 进 制 转换 到 十 六 进 制 很 容易 ， 反 之 亦 然 。 这 是 因为 二 进 制 中 的 4 位 恰好 
是 十 六 进 制 中 的 1 位 。 
e 将 数字 从 二 进 制 转换 到 八进制 很 容易 ， 反 之 亦 然 。 这 是 因为 二 进 制 中 的 3 位 恰好 是 
八进制 中 的 1 位 。 


2.5 练习 
， 小 测验 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 测验 题 。 强 烈 建议 学 生 在 继续 本 章 习 题 前 首 
先 完成 相关 测验 题 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 定义 一 个 数字 系统 。 

2. 辨析 位 置 化 和 非 位 置 化 数字 系统 。 

3. 定义 位 置 化 数字 系统 中 的 底 或 基数 。 位 置 化 数字 系统 中 ， 底 与 符号 的 数量 有 什么 关系 ? 
4. 简 述 十 进 制 系统 。 为 什么 称 作 十 进 制 ? 该 系统 的 底 是 多 少 ? 

5. 简 述 二 进 制 系统 。 为 什么 称 作 二 进 制 ? 该 系统 的 底 是 多 少 ? 

6. 简 述 八进制 系统 。 为 什么 称 作 八进制 ? 该 系统 的 底 是 多 少 ? 

7. 简 述 十 六 进 制 系统 。 为 什么 称 作 十 六 进 制 ? 该 系统 的 底 是 多 少 ? 

8. 为 什么 二 进 制 和 十 六 进 制 互 换 很 容易 ? 

9. 十 六 进 制 系统 中 + 个 数码 表示 二 进 制 系统 中 的 几 位 ? 

10. 八进制 系统 中 1 个 数码 表示 二 进 制 系统 中 的 几 位 ? 


练习 题 
1. 将 下 列 二 进 制 数 转换 为 十 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 

a. (01101)， b. (1011000); c. (011110.01); d. (111111.111); 
2. 将 下 列 十 六 进 制 数 转换 为 十 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 

a. (AB2)is b. (123)i6 c. (ABB)'s d. (35E.E1)is 
3; 将 下 列 八进制 数 转换 为 十 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 

a. (237)s b. (2731)s c. (617.7)s d. (21.11) 
4. 将 下 列 十 进 制 数 转换 为 二 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 

a. 1234 b. 88 c. 124.02 d. 14.56 
5. 将 下 列 十 进 制 数 转 换 为 八进制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 

a. 1156 b. 99 c. 11.4 d. 72.8 
6. 将 下 列 十 进 制 数 转换 为 十 六 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 

a. 567 b. 1411 c. 12.13 d. 16.5 
7. 将 下 列 八 进 制 数 转换 为 十 六 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 

a. (514)s b. (411)s c. (13.7)s d. (1256)s 


8. 将 下 列 十 六 进 制 数 转换 为 八进制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 
a. (51A)i b. (4B1)is c. (BB.C)is d. (ABC.D)'s 
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9. 将 下 列 二 进 制 数 转换 为 八进制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 


a. (01101); b. (1011000); c. (011110.01): d. (111111.111); 
10. 将 下 列 二 进 制 数 转换 为 十 六 进 制 数 ， 不 用 计算 器 并 写 出 计算 过 程 : 

a. (01101): b. (1011000); c. (011110.01); d. (111111.111); 
11. 将 下 列 十 进 制 数 转换 为 二 进 制 数 ， 使 用 例 2.17 中 讨论 的 另 一 种 方法 ， 并 写 出 计算 过 程 : 

a. 121 b. 78 c. 255 d. 214 
12. 将 下 列 十 进 制 数 转换 为 二 进 制 数 ， 使 用 例 2.18 中 讨论 的 另 一 种 方法 ， 并 写 出 计算 过 程 : 

a. 35/s b. 123/2 c. 4/6 d. 125/28 


13. 在 底 为 b 的 位 置 化 数字 系统 中 ， 可 用 个 数码 表示 的 最 大 整数 数字 是 bp'-1。 分 别 找 出 以 下 系统 中 使 
用 6 个 数码 的 最 大 数字 : 


a. 二 进 制 b. 十 进 制 c. 十 六 进 制 d. 八进制 
14. 不 进行 转换 ， 找 出 下 面 各 个 情况 中 在 目标 系统 中 所 需 的 最 少数 码 数量 : 
a. 5 个 十 进 制 数 码 转换 为 二 进 制 b. 4 个 十 进 制 数 码 转换 为 八进制 


c. 7 个 十 进 制 数码 转换 为 十 六 进 制 

15. 不 进行 转换 ， 找 出 下 面 各 个 情况 中 在 目标 系统 中 所 需 的 最 少数 码 数量 : 
a. 5 位 二 进 制 数 码 转换 为 十 进 制 b. 3 个 八进制 数码 转换 为 十 进 制 
c. 3 个 十 六 进 制 数码 转换 为 十 进 制 

16. 下 表 显 示 如 何 重 写 小 数 ， 使 其 分 母 是 2 的 寡 次 (1，2，4，8，16 等 等 )。 


但 是 ， 我们 有 时 需要 组 合 它 们 以 得 到 合适 的 小 数 。 例 如 ，0.625 是 0.5+0.125。 这 就 意味 0.625 
可 以 写成 /2+l/s 或 5/s。 
将 下 列 十 进 制 小 数 改 写 为 带 2 的 适 次 的 小 数 : 






1/2 
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a. 0.1 875 b. 0.640 625 c. 0.40 625 d. 0.375 
17. 使 用 前 面 的 解 题 方法 ， 把 下 列 数 转换 为 二 进 制 数 : 

a. 7.1 875 b. 12.640 625 c. 11.40 625 d. 0.375 
18. 找 出 下 列 情形 的 整数 最 大 值 : 

a. b=10, k=10 b. b=2, 512 c. b=8, k=8 d. b=16, k=7 
19. 找 出 用 于 存储 下 列 整数 所 需 的 最 小 位 数 : 

a. 小 于 1000 b. 小 于 100 000 c. 小 于 64 d. 小 于 256 
20. 一 个 小 于 b* 的 数 可 以 用 以 4b 为 底 的 个 数码 表示 。 求 下 列 情况 各 需要 数码 的 数量 : 

a. 小 于 2" 的 二 进 制 整数 b. 小 于 10 的 十 进 制 整数 

c. 小 于 8” 的 八进制 整数 d. 小 于 16 的 十 六 进 制 整数 


21. 一 个 用 于 因特网 的 公共 底 是 b=256。 我 们 使 用 256 个 符号 来 表示 该 系统 中 的 数字 。 设 计 者 使 用 十 进 
制 数字 0 到 255 来 表示 其 中 一 个 符号 ， 而 不 是 创建 大 量 的 新 符号 。 也 就 是 说 ， 符 号 集 是 5={0, 1,2， 
3，…，255}。 该 系统 中 的 数字 总 是 以 51.52.53.54 这 种 4 个 符号 间隔 3 个 点 的 形式 出 现 。 该 系统 用 
于 定义 因特网 的 网 址 (参见 第 6 章 )。 例 如 ， 该 系统 中 的 一 个 地 址 是 10.200.14.72， 等 价 于 十 进 制 中 
的 10 x 2563+200 x 256?+14 x 256!+72 x 256%=180883016。 这 个 数字 系统 称 为 点 十 进 制 计数 法 。 写 
出 下 列 因特网 地 址 的 十 进 制 数 值 : 

a. 17.234.34.14 b. 14.56.234.56 c. 110.14.56.78 d. 24.56.13.11 
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前 面 问题 中 因特网 地 址 也 可 以 表示 为 位 模式 。 这 种 情况 ， 用 32 位 表示 一 个 地 址 。 在 点 十 进 制 计 
数 法 中 的 一 个 符号 用 8 位。 例如， 地 址 10.200.14.72， 也 可 表示 为 00001010 11001000 00001110 
01001000。 用 位 表示 下 列 因特网 地 址 : 


a. 17.234.34.14 b. 14.56.234.56 c. 110.14.56.78 d. 24.56.13.11 
. 写 出 等 值 下 列 罗马 数字 的 十 进 制 数 : 

a. XV b. XXVI c. VIM d. MCLVI 

把 下 列 十 进 制 数 转换 成 罗马 数字 : 

a. 17 b. 38 c. 82 d. 999 
. 找 出 下 列 有 错 的 罗马 数字 : 

a. MMIM b. MIC c. CVC d.VX 


玛雅 文明 发 明了 位 置 化 的 二 十 进 制 (以 20 为 底 ) 数字 系统 ， 称 为 玛雅 数字 系统 。 他 们 用 20 为 底 可 
能 是 因为 他 们 使 用 手指 和 脚趾 一 起 来 计数 。 该 系统 使 用 的 20 个 符号 建立 在 3 个 更 简单 的 符号 之 上 。 
该 系统 的 先进 特征 在 于 它 有 符号 0， 是 一 个 外 壳 。 另 外 2 个 符号 是 一 个 圈 (或 一 个 鹅卵石 ) 表示 1， 
以 及 一 个 横 杆 〈 或 一 个 棍子 ) 表示 5。 为 表示 大 于 19 的 数字 ， 数 字 竖 写 。 在 因特网 搜索 以 下 问题 的 
答案 : 十 进 制 数 12、123、452 和 1256 在 玛雅 数字 系统 中 是 什么 ? 

巴比伦 文明 发 展 了 首 个 位 置 化 数字 系统 ， 称 为 巴比伦 数字 系统 。 他 们 继承 了 闪 族 人 和 阿 卡 得 人 的 数 
字 系 统 。 将 其 发 展 为 位 置 化 的 六 十 进 制 (以 60 为 底 ) 数字 系统 。 该 底 现今 还 用 于 时 间 和 和 角度。 例 
如 ，1 小 时 为 60 分 钟 ; 1 分钟 为 60 秒 。 同 样 ，1 度 为 60 分; 1 分 为 60 秒 。 作 为 底 为 b 的 位 置 化 
系统 需要 b 个 符号 (数码)， 我 们 希望 一 个 位 置 化 的 六 十 进 制 系统 有 60 种 符号 。 但 是 巴比伦 人 没有 
符号 0， 而 且 通 过 堆 释 表示 1 和 10 的 2 个 符号 构造 出 其 他 59 个 符号 。 在 因特网 搜索 以 下 问题 的 
答案 : 

a. 用 巴比伦 数字 表示 十 进 制 数 : 11 291，3646，3582。 

b. 指出 没有 符号 0 可 能 出 现 的 问题 。 巴 比 伦 数字 系统 是 如 何 解决 这 个 问题 的 ? 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通过 


尝试 这 些 应 用 程序 来 加 深 对 每 章 讨论 材料 的 理解 。 
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数据 存储 





正如 第 1 章 所 述 ， 计 算 机 是 一 个 可 编程 的 数据 处 理 机 器 。 在 谈论 处 理 数据 之 前 ， 我 们 需 
要 理解 数据 的 特性 。 在 本 章 ， 我 们 讨论 不 同 的 数据 类 型 以 及 它们 是 如 何 存储 在 计算 机 中 的 。 
第 4 章 讲解 计算 机 内 部 是 如 何 控制 数据 的 。 
目标 
通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 
e 列 出 计算 机 中 使 用 的 5 种 不 同 的 数据 类 型 ; 
描述 不 同 的 数据 如 何以 位 模式 存储 在 计算 机 内 部 ; 
描述 整数 如 何以 无 符号 格式 存储 在 计算 机 中 ; 
描述 整数 如 何以 符号 加 绝对 值 格式 存储 在 计算 机 中 ; 
描述 整数 如 何以 二 进 制 补 码 格式 存储 ; 
描述 实数 如 何以 浮 点 格式 存储 在 计算 机 中 ; 
描述 文本 如 何 通过 各 种 不 同 的 编码 系统 存储 在 计算 机 中 ; 
描述 音频 如 何 通过 采样 、 量 化 和 编码 存储 在 计算 机 中 ; 
描述 图 像 如 何 通过 光栅 和 矢量 图 模式 存储 在 计算 机 中 ; 
描述 视频 如 何以 图 像 随 时 间 变 化 的 表示 来 存储 在 计算 机 中 。 


3.1 数据 类 型 


如 今 ， 数 据 以 不 同 的 形式 出 现 ， 如 : 数字 、 文 本 、 音 频 、 图 像 和 视频 (图 3-1 )。 
人 们 需要 能 够 处 理 许多 不 同 的 数据 类 型 
。 工程 程序 使 用 计算 机 的 主要 是 目的 是 ee 
处 理 数字 进行 算术 运算 、 求 解 代数 [到 字 ] [文本 ] | 吝 颇 ] | 国信 ] | 视频 
或 三 角 方 程 、 找 出 微分 方程 的 根 等 。 a 
。 与 工程 程序 不 同 的 是 ， 文 字 处 理 程序 
使 用 计算 机 的 主要 目的 是 处 理 文本 : 调整 对 齐 、 移 动 、 删 除 等。 
计算 机 同样 也 处 理 音 频数 据 。 我 们 可 以 使 用 计算 机 播放 音乐 ， 并 且 可 以 把 声音 作为 
数据 输入 到 计算 机 中 。 
> 创建 、 收 缩 、 放 大 、 施 转 等 。 
。 最 后 ， 计 算 机 不 仅 能 用 来 播放 电影 ， 还 能 创建 我 们 在 电影 中 所 看 到 的 特技 效果 。 
计算 机 行业 中 使 用 术语 “多 媒体 ”来 定义 包含 数字 、 文 本 、 图 像 、 音 频 和 视频 的 信息 。 
计算 机 内 部 的 数据 
所 有 计算 机 外 部 的 数据 类 型 的 数据 都 采用 统一 的 数据 表示 法 转换 后 存 人 计算 机 中 ， 当 数 
据 从 计算 机 输出 时 再 还 原 回来 。 这 种 通用 的 格式 称 为 位 模式 。 


1. 位 
位 (bit, binary digit 的 缩写 ) 是 存储 在 计算 机 中 的 最 小 单位 ; 它 是 0 或 1。 位 代表 设备 的 
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某 一 状态 ， 这 些 设备 只 能 处 于 两 种 状态 之 一 。 例 如 ， 开 关 要 么 合 上 要 么 断 开 。 用 1 表示 合 上 
状态 , 0 表示 断 开 状 态 。 电 子 开关 就 表示 一 个 位 。 换 名 话说， 一 个 开关 能 存储 一 个 位 的 信息 。 
今天 ， 计 算 机 使 用 各 种 各 样 的 双 态 设备 来 存储 数据 。 

2. 位 模式 

为 了 表示 数据 的 不 同类 型 ， 应 该 使 用 位 模式 ， 它 是 一 个 序列 ， 有 时 也 被 称 为 位 流 。 图 3-2 
展示 了 由 16 个 位 组 成 的 位 模式 。 它 是 0 和 !1 的 组 合 。 这 就 意味 着 ， 如 果 我 们 需要 存储 一 个 
由 16 个 位 组 成 的 位 模式 ,那么 需要 16 个 电子 开关 。 如 果 我 们 G64o10111111 
需要 存储 1000 个 位 模式 ， 每 个 16 位 ， 那 么 需要 16 000 个 开关 。 图 3-2 位 模式 
通常 长 度 为 8 的 位 模式 被 称 为 1 字 节 。 有 时 用 字 这 个 术语 指 代 更 
长 的 位 模式 。 

正如 图 3-3 所 示 ， 属 于 不 同 数据 类 型 的 数据 可 以 以 同样 的 模式 存储 于 内 存 中 。 


| 


键盘 输入 
字符 


声音 | | 人 ~。 上 


"nA" 








录音 机 存储 器 
部 分 电影 ET DER 
摄像 机 存储 器 


图 3-3 不 同 数据 类 型 的 存储 


如 果 使 用 文本 编辑 器 (文字 处 理 器 )， 键 盘 上 的 字符 A 可 以 以 8 位 模式 01000001 存储 。 
如 果 使 用 数学 程序 ， 同 样 的 8 位 模式 可 以 表示 数字 65。 类 似 地 ， 同 样 的 位 模式 可 表示 部 分 
图 像 、 部 分 歌曲 、 影 片 中 的 部 分 场景 。 计 算 机 内 存 存 储 所 有 这 些 而 无 需 辨 别 它 们 表示 的 是 何 
种 数据 类 型 。 

3. 数据 压缩 

为 占用 较 少 的 内 存 空 间 ， 数 据 在 存储 到 计算 机 之 前 通常 被 压缩 。 数 据 压缩 是 一 个 广阔 的 
主题 ， 所 以 我 们 用 整个 第 15 章 来 讲述 。 





pq 
另 一 个 与 数据 有 关 的 话题 是 在 传输 和 存储 数据 时 的 错误 检测 和 纠正 。 我 们 在 附录 旦 中 
简要 讨论 这 个 话题。 





和 纠正 在 附录 HH 中 讨论 。 


3.2 ”存储 数字 
在 存储 到 计算 机 内 存 中 之 前 ， 数 字 被 转换 到 二 进 制 系统 ， 如 第 2 章 所 述 。 但 是 ， 这 里 还 
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有 两 个 问题 需要 解决 : 

1 ) 如 何 存储 数字 的 符号 。 

2 ) 如 何 显示 十 进 制 小 数 点 。 

有 多 种 方法 可 处 理 符号 问题 ， 本 章 后 面 陆续 讨论 。 对 于 小 数 点 ， 计 算 机 使 用 两 种 不 同 的 
表示 方法 : 定点 和 浮 点 。 第 一 种 用 于 把 数字 作为 整数 存储 一 一 没有 小 数 部 分 ， 第 二 种 把 数字 
作为 实数 存储 一 一 带 有 小 数 部 分 。 


3.2.1 存储 整数 


整数 是 完整 的 数字 ( 即 没 有 小 数 部 分 )。 例 如 ，134 和 -125 是 整数 而 134.23 和 -0.235 
则 不 是 。 整 数 可 以 被 当 作 小 数 点 位 置 固定 的 数字 : 小数点 固定 在 最 右边 。 因 此 ， 定 点 表示 法 
用 于 存储 整数 ， 如 图 3-4 所 示 。 在 这 种 表示 法 中 ， 小 数 点 是 假定 的 ， 但 并 不 存储 。 


[01111oLILIolololiolollllojle 
存储 单元 
小 数 点 
(假定 位 置 ) 


图 3-4 整数 的 定点 表示 法 


但 是 ， 用 户 (或 程序 ) 可 能 将 整数 作为 小 数 部 分 为 0 的 实数 存储 。 这 是 可 能 发 生 的 ， 例 
如 ， 整 数 太 大 以 至 于 无 法 定义 为 整数 来 存储 。 为 了 更 有 效 地 利用 计算 机 内 存 ， 无 符号 和 有 符 
RE 





1. 无 符号 表示 法 

无 符号 整数 是 只 包括 零 和 正 数 的 非 负 整数 。 它 的 范围 介 于 0 到 无 穷 大 之 间 。 然 而 ， 由 于 
计算 机 不 可 能 表示 这 个 范围 的 所 有 整数 ， 通 常 ， 计 算 机 都 定义 了 一 个 常量 ， 称 为 最 大 无 符号 
整数 ， 它 的 值 是 (2"-1 )。 这 里 n 就 是 计算 机 中 分 配 用 于 表示 无 符号 整数 的 二 进 制 位 数 。 

(1 ) 存储 无 符号 整数 

输入 设备 存储 无 符号 整数 使 用 以 下 步 又: 

1 ) 首先 将 整数 变 成 二 进 制 数 。 

2 ) 如 果 二 进 制 位 数 不 足 n 位 ， 则 在 二 进 制 数 的 左边 补 0 使 它 的 总 位 数 为 nn 位。 如 果 
位 数 大 于 n， 该 整数 无 法 存储 。 导 致 溢出 的 情况 发 生 ， 我 们 后 面 要 讨论 。 

例 3.1 将 7 存储 在 8 位 存储 单元 中 ， 使 用 无 符号 表示 法 。 


解 ”首先 将 数字 转换 为 二 进 制 数 (111)。 加 5 个 0 使 总 的 位 数 为 8 位 ， 即 (00000111)2。 
再 将 该 整数 保存 在 存储 单元 中 。 注 意 ， 右 下 角 的 2 用 于 强调 该 整数 是 二 进 制 的 ， 并 不 存储 在 
计算 机 中 。 
把 7 变 为 二 进 制 = 1 1 1 
在 左边 加 5 位 一 000001 .11 


例 3.2 将 258 存储 在 16 位 存储 单元 中 。 
解 ”首先 把 数字 转换 为 二 进 制 数 (100000010)2。 加 7 个 0 使 总 的 位 数 满足 16 位 的 要 求 ， 
即 得 到 (0000000100000010):。 再 将 该 整数 存储 在 存储 单元 中 。 
把 258 变 为 二 进 制 ”一 100000010 
在 左边 加 7 位 一 0000000100000010 
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( 2 ) 译 解 无 符号 整数 
输出 设备 译 解 内 存 中 位 模式 的 位 串 并 转换 为 一 个 十 进 制 的 无 符号 整数 。 
例 3.3 当 译 解 作 为 无 符号 整数 保存 在 内 存 中 的 位 串 00101011 时 ， 从 输出 设备 返回 
什么 ? 
解 ”使 用 第 2 章 的 解 题 过 程 ， 二 进 制 整数 转换 为 十 进 制 无 符号 整数 43。 
(3 ) 溢出 
因为 大 小 〈 即 存储 单元 的 位 的 数量 ) 的 限制 ， 可 以 表达 的 整数 范围 是 有 限 的 。 在 n 位 存 
俏 单 元 中 ,我 们 可 以 存 情 的 无 符号 整数 ,| 可 表示 的 整数 . : 
仅 为 0 到 2”-1 之 间 。 图 3-5 显示 了 如 果 TT 
存储 大 于 24_1=15 的 整数 到 仅 为 4 位 的 内 0 1 2 3 4 i 17 18 19 20... 
存 中 所 发 生 的 情况 。 例 如 ,保存 整数 11 
在 存储 单元 中 ， 又 试图 再 加 上 9， 就 发 生 
了 这 种 称 为 溢出 的 情况 。 表 示 十 进 制 数 20 
的 最 小 位 数 是 5 位 ， 即 20=(10100),， 所 
以 计算 机 丢掉 最 左边 的 位 ， 并 保留 最 右边 
的 4 位 (0100),。 当 人 们 看 到 新 的 整数 显 要 | 
示 为 4 而 不 是 20 时 很 惊讶 。 图 3-5 显示 1000 0111 
了 为 什么 会 发 生 这 种 情况 。 图 3-5 “无 符号 整数 的 溢出 
(4 ) 无 符号 整数 的 应 用 
无 符号 整数 表示 法 可 以 提高 存储 的 效率 ， 因 为 不 必 存储 整 数 的 符号 。 这 就 意味 着 所 有 分 
配 的 位 单元 都 可 以 用 来 存储 数字 。 只 要 用 不 到 负 整 数 ， 都 可 以 用 无 符号 整数 表示 法 。 具 体 情 
况 如 下 : 
e 计数 : 当 我 们 计数 时 ， 不 需要 负数 。 可 以 从 1 (有 时 0 ) 开始 增长 。 
e 寻 址 : 有 些 计算 机 语言 ， 在 一 个 存储 单元 中 存储 了 另 一 个 存储 单元 的 地 址 。 地 址 都 
是 从 0 (存储 器 的 第 一 个 字 节 ) 开始 到 整个 存储 器 的 总 字 节 数 的 正 数 ， 在 这 里 同样 也 
不 需要 用 到 负数 。 因 此 无 符号 整数 可 以 轻松 地 完成 这 个 工作 。 
e 存储 其 他 数据 类 型 : 我 们 后 面 将 谈 到 的 其 他 数据 类 型 (文本 、 图 像 、 音 频 和 视频 ) 是 
以 位 模式 存储 的 ， 可 以 翻译 为 无 符号 整数 。 
2. 符号 加 绝对 值 表 示 法 
尽管 符号 加 绝对 值 格式 在 存储 整数 中 并 不 常用 ， 但 该 格式 用 于 在 计算 机 中 存储 部 分 实 
数 ， 正 如 下 一 节 所 述 。 因 此 ， 我 们 在 这 里 简要 讨论 该 格式 。 在 这 种 方法 中 ， 用 于 无 符号 整 
数 的 有 效 范 围 〈《0 到 2"-1 ) 被 分 成 两 个 相等 的 子 范 围 。 前 半 个 表示 正 整数 ， 后 半 个 表示 负 整 
数 。 例 如 ，n 为 4， 该 范围 是 0000 到 1111。 这 个 范围 被 分 为 两 半 : 0000 到 0111 以 及 1000 
到 1111 (图 3-6 )。 这 种 位 模式 赋值 为 正 的 和 负 的 整数 。 注 意 ， 负 数 出 现在 正 数 的 右边 ， 与 
常规 的 关于 正 负数 的 思维 相反 。 还 要 注意 该 系统 中 有 两 个 0: 正 0( 0000) 和 负 0 (1000 )。 
0000 0001 0010 0011 0100 0101 0110 0111|1000 1001 1010 1 
0 1 2 3 4 5 6 
图 3-6 符号 加 绝对 值 的 表示 法 


用 符号 加 绝对 值 格式 存储 一 个 整数 ， 需 要 用 1 个 二 进 制 位 表示 符号 (0 表示 正 ，1 表示 
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负 )。 这 就 意味 着 在 一 个 8 位 存储 单元 中 ， 可 以 仅 用 7 位 表示 数字 的 绝对 值 (不 带 符号 ) 。 因 
此 ， 最 大 的 正 数 值 仅 是 无 符号 最 大 数 的 一 半 。 在 n 位 单元 可 存储 的 数字 范围 是 - (2”'-1) 
至 + (2”"'-1), n 位 单元 中 最 左 位 分 配 用 于 存储 符号 (0 表示 正 ，1 表示 负 )。 
在 符号 加 绝对 值 表示 法 中 ， 最 左 位 用 于 定义 整数 的 符号 。0 表示 正 整数 ,1 表示 负 整 数 s 
例 3.4 用 符号 加 绝对 值 表示 法 将 +28 存储 在 8 位 存储 单元 中 。 
解 ” 先 把 该 整数 转换 成 7 位 的 二 进 制 数 。 最 左边 位 置 0， 即 存储 为 8 位 数 。 
把 28 变 为 7 位 的 二 进 制 00 1 1 10 0 
加 符号 位 并 存储 回 0011100 
例 3.5 用 符号 加 绝对 值 表示 法 将 -28 存储 在 8 位 存储 单元 中 。 
解 ” 先 把 该 整数 转换 成 7 位 的 二 进 制 数 。 最 左边 位 置 1， 即 存储 为 8 位 数 。 
把 28 变 为 7 位 的 二 进 制 00 1 1 100 
加 符号 位 并 存储 国 0011100 
例 3.6 将 用 符号 加 绝对 值 表 示 法 存储 的 01001101 复原 成 整数 。 
解 ” 因 为 最 左 位 是 0， 符号 为 正 。 其 余 位 (1001101 ) 转换 成 十 进 制 数 77。 加 上 符号 后 
该 整数 是 +77。 
例 3.7 将 用 符号 加 绝对 值 表示 法 存储 的 10100001 复原 成 整数 。 
解 ” 因 为 最 左 位 是 1， 符 号 为 负 。 其 余 位 (0100001 ) 转换 成 十 进 制 数 33。 加 上 符号 后 
该 整数 是 -33。 
(1 ) 符号 加 绝对 值 表示 法 的 溢出 
同 无 符号 整数 一 样 ， 有 符号 的 整数 也 会 溢出 。 但 是 ， 这 时 我 们 可 能 有 正 负 两 种 溢出 情 
况 。 图 3-7 显示 了 当 使 用 4 位 内 存单 元 存储 一 个 用 符号 加 绝对 值 表示 法 的 整数 时 出 现 的 正 负 
两 种 溢出 。 当 我 们 试图 存储 一 个 比 7 大 的 正 整数 时 ， 出 现 正 溢出 。 例 如 ， 我 们 保存 整数 5 在 
存储 单元 中 ， 又 试图 再 加 上 6。 我 们 期 望 结果 是 11， 但 计算 机 响应 为 -3。 这 是 因为 在 一 个 
循环 的 表示 中 ， 从 5 开始 顺 时 针 走 6 个 单位 ， 就 停 在 -3。 一 个 正 数 溢出 将 整数 限制 在 该 范 
围 中 。 





lle 3 -2 -1 :+*01 2 3.…7.… 11 
a) 一 个 符号 加 绝对 值 格式 的 整数 的 线性 特征 





1 0110 001 0110 
1000 0111 1000 0111 
b) 负数 溢出 c) 正 数 滋 出 
图 3-7 ”符号 加 绝对 值 表 示 法 的 溢出 
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当 我 们 试图 存储 一 个 比 -7 小 的 负 整 数 时 ， 出 现 负 溢出 。 例 如 ， 我 们 保存 整数 -5 在 存储 
单元 中 ， 又 试图 再 减 去 7。 我 们 期 望 结果 是 -12， 但 计算 机 响应 为 +6。 这 是 因为 在 一 个 循环 
的 表示 中 ， 从 -5 开始 道 时 针 走 7 个 单位 ， 就 停 在 +6 了 。 

在 符号 加 绝对 值 表示 法 中 ， 有 两 个 0: +0 和 =0。 

(2 ) 符号 加 绝对 值 表示 法 的 应 用 

符号 加 绝对 值 表示 法 不 用 于 存储 整数 ， 而 用 于 存储 部 分 实数 ， 我 们 后 面 会 看 到 。 另 外 ， 
符号 加 绝对 值 表示 法 通常 用 于 采样 模拟 信和 号， 例如， 音频 。 

3. 二 进 制 补 码 表示 法 

几乎 所 有 的 计算 机 都 使 用 二 进 制 补 码 表示 法 来 存储 位 于 位 存储 单元 中 的 有 符号 整数 。 
这 一 方法 中 ， 无 符号 整数 的 有 效 范 围 (0 到 2“-1 ) 被 分 为 两 个 相等 的 子 范围 。 第 一 个 子 范 围 
用 来 表示 非 负 整数 ， 第 二 个 子 范围 用 于 表示 负 整 数 。 例 如 ， 如 果 n 是 4， 该 范围 是 0000 到 
1111。 这 个 范围 分 为 两 半 : 0000 到 0110 以 及 1000 到 1111。 这 两 半 按 照 左 负 右 正 的 常规 互 
I 





i 
图 3-8 ”二进制 补 码 表示 法 


尽管 整数 的 符号 影响 二 进 制 整数 存储 时 的 每 一 位 ， 但 是 首位 (最 左 位 ) 决定 符号 。 如 果 
最 左 位 是 0， 该 整数 非 负 ; 如 果 最 左 位 是 1， 该 整数 是 负数 。 

ea ae ce 该 整数 为 正 ; 如果 是 1， 

该 整数 为 负 。、 

(1 ) 两 种 运算 

在 深入 讨论 这 种 表示 法 之 前 ， 我 们 需要 介绍 两 种 运算 。 第 一 种 称 为 反 码 或 取 一 个 整数 的 
反 码 。 该 运算 可 以 应 用 到 任何 整数 ， 无 论 是 正 的 还 是 负 的 。 该 运算 简单 反 转 各 个 位 ， 即 把 0 
位 变 为 1 位 ,把 1 位 变 为 0 位 。 

例 3.8 下 面 显示 我 们 如 何 取 整数 00110110 的 反 码 。 


原来 的 模式 001 10110 
进行 反 码 运算 eo 
例 3.9 下 面 显示 我 们 如 果 进 行 2 次 反 码 运算 ， 就 可 以 得 到 原先 的 整数 。 
原来 的 模式 00 1 10 1 10 
进行 1 次 反 码 运算 
进行 2 次 反 码 运算 00 1 10 110 


第 二 种 运算 称 为 二 进 制 中 的 补 码 或 取 一 个 整数 的 补 码 。 该 运算 分 为 两 步 : 首先 ， 从 右边 
复制 位 ， 直 到 有 1 被 复制 ; 接着 ， 反 转 其 余 的 位 。 
例 3.10 下 面 显示 我 们 如 何 取 整 数 00110100 的 补 码 。 
原来 的 模式 0011010 
4 汪汪 十 
进行 1 次 补 码 运 算 1 1 0 0 
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例 3.11 下 面 显示 我 们 如 果 进 行 2 次 补 码 运算 ,就 可 以 得 到 原先 的 整数 。 


原来 的 模式 00 1 10 10 0 
出 四 
进行 1 次 补 码 运算 1 0 0 
二 
进行 2 次 补 码 运算 EN 1 0 0 
另 一 种 将 一 个 整数 进行 补 码 运算 的 方法 是 先 对 它 进 行 1 次 反 码 运算 再 加 上 1 得 到 结果 


(参见 第 4 章 的 二 进 制 加 法 )。 

(2 ) 以 二 进 制 补 码 格式 存储 整数 

以 二 进 制 补 码 格式 存储 整数 ， 计 算 机 遵循 以 下 步骤 : 

e 将 整数 变 成 n 位 的 二 进 制 数 。 

e@ 如 果 整 数 是 正 数 或 零 ， 以 其 原样 存储 ; 如 果 是 负数 ， 计 算 机 取 其 补 码 存储 。 

(3 ) 从 二 进 制 补 码 格式 还 原 整数 

从 二 进 制 补 码 格 式 还 原 整数 ， 计 算 机 遵循 以 下 步 又 : 

e 如 果 最 左 位 是 1， 计算 机 取 其 补 码 。 如 果 最 左 位 是 0， 计算 机 不 进行 操作 。 

e 计算 机 将 该 整数 转换 为 十 进 制 。 

例 3.12 ”用 二 进 制 补 码 表示 法 将 整数 28 存储 在 8 位 存储 单元 中 。 

解 ”该 整数 是 正 数 (无 符号 意味 是 正 的)， 因 此 在 把 该 整数 从 十 进 制 转换 成 二 进 制 后 不 
再 需要 其 他 操作 。 注 意 ，3 个 多 余 的 零 加 到 该 整数 的 左边 使 其 成 为 8 位 。 

把 28 变 为 8 位 的 二 进 制 000 1 1 10 0 

例 3.13 用 二 进 制 补 码 表示 法 将 整数 -28 存储 在 8 位 存储 单元 中 。 

解 ” 该 整数 是 负数 ， 因 此 在 转换 成 二 进 制 后 计算 机 对 其 进行 二 进 制 补 码 运算 。 


把 28 变 为 8 位 的 二 进 制 000 1 1 10 0 
上 
进行 补 码 运算 1 0 0 


例 3.14 将 用 二 进 制 补 码 表示 法 存储 在 8 位 存储 单元 中 的 00001101 还 原 成 整数 。 
解 ” 最 左 位 是 0， 因 此 符号 为 正 。 该 整数 需要 转换 为 十 进 制 并 加 上 符号 即 可 。 


最 左 位 是 0， 符 号 为 正 0000 1 101 
整数 转换 为 十 进 制 13 
加 上 符号 (可 选 ) +13 


例 3.15 将 用 二 进 制 补 码 表示 法 存储 在 8 位 存储 单元 中 的 11100110 还 原 成 整数 。 
解 ” 最 左 位 是 1， 因此 符号 为 负 。 在 整数 转换 为 十 进 制 前 进行 补 码 运算 。 

最 左 位 是 1， 符 号 为 负 1 1 100 1 10 

i | 

0 


进行 补 码 运 算 C0 1 0 
整数 转换 为 十 进 制 26 
加 上 符号 -26 


二 进 制 补 码 表示 法 很 有 趣 的 一 点 是 该 表示 法 仅 有 一 个 0。 而 符号 加 绝对 值 表示 法 则 有 两 
个 0 (+0 和 -0)。 
二进制 补 码 表示 法 仅 有 一 个 0。 
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(4) 二 进 制 补 码 表示 法 的 溢出 

同 其 他 表示 法 一 样 ， 以 二 进 制 补 码 表示 法 存储 的 整数 也 会 溢出 。 图 3-9 显示 了 当 使 用 4 
位 存储 单元 存储 一 个 带 符号 的 整数 时 出 现 的 正 负 两 种 溢出 。 当 我 们 试图 存储 一 个 比 7 大 的 正 
整数 时 ， 出 现 正 溢出 。 例 如 ， 我 们 保存 整数 5 在 存储 单元 中 ， 又 试图 再 加 上 6。 我 们 期 望 结 
果 是 11, 但 计算 机 响应 为 -5。 这 是 因为 在 一 个 循环 的 表示 中 ， 从 5 开始 顺 时 针 走 6 个 单位 ， 
就 停 在 -5。 一 个 正 数 溢出 将 整数 限制 在 该 范围 中 。 





负数 溢出 正 数 溢出 
图 3-9 二 进 制 补 码 表 示 法 的 溢出 


当 我 们 试图 存储 一 个 比 -8 小 的 负 整 数 时 ， 出 现 负 液 出。 例如， 我 们 保存 整数 -3 在 存储 
单元 中 ， 又 试图 再 减 去 7。 我 们 期 望 结 果 是 -10， 但 计算 机 响应 为 +6。 这 是 因为 在 一 个 循环 
的 表示 中 ， 从 -3 开始 逆 时 针 走 7 个 单位 ， 就 停 在 +6 了 。 

(5 ) 二 进 制 补 码 表 示 法 的 应 用 

当今 ， 二 进 制 补 码 表示 法 是 计算 机 中 用 于 存储 整数 的 标准 表示 法 。 在 下 一 章 中 ， 当 你 发 
现 使 用 二 进 制 补 码 带 来 运算 上 的 简便 后 就 会 明白 为 什么 这 么 说 。 


3.2.2 3 种 系统 的 比较 


表 3-1 显示 了 无 符号 、 二 进 制 补 码 和 符号 加 绝对 值 表示 法 的 对 比 。4 位 存储 单元 可 以 存 
储 0 一 15 之 间 的 无 符号 整数 ;同样 存储 单元 可 以 存储 -8 ~ +7 之 间 的 二 进 制 补 码 整数 。 我 
们 用 同样 的 格式 存储 和 还 原 整数 ， 这 一 点 很 重要 。 例 如 ， 如 果 13 存 为 有 符号 格式 的 ， 就 需 
要 将 其 还 原 成 有 符号 格式 的 ; 同样 以 二 进 制 补 码 格式 的 -3 可 以 还 原 到 原样 。 


表 3-1 整数 表示 法 小 结 





发 据 冶 人 馆 35 





3.2.3 ”实数 


实数 是 带 有 整数 部 分 和 小 数 部 分 的 数字 。 例 如 ，23.7 是 一 个 实数 一 一 整数 部 分 是 23 而 
小 数 部 分 是 710。 尽 管 固定 小 数 点 的 表示 法 可 用 于 表示 实数 ,但 结果 不 一 定 精确 或 达 不 到 需 
要 的 精度 。 以 下 两 个 例子 说 明了 原因 。 

例 3.16 在 十 进 制 系统 中 ， 假 定 我 们 用 一 种 小 数 点 右边 2 个 数码 ， 左 边 14 个 数码 ， 总 
共 16 个 数码 的 定点 表示 法 。 那 么 如 果 试 图 表示 十 进 制 数 1.002 34， 该 系统 的 实数 精度 就 会 
受 损 。 该 系统 把 这 个 数字 存储 为 1.00。 

例 3.17 在 十 进 制 系统 中 ， 假 定 用 一 种 小 数 点 右边 6 个 数码 ， 左 边 10 个 数码 ， 总 共 16 
个 数码 的 定点 表示 法 。 那 么 如 果 试 图 表示 十 进 制 数 236 154 302 345.00， 该 系统 的 实数 精度 
就 会 受 损 。 该 系统 把 这 个 数字 存储 为 6 154 302 345.00。 整 数 部 分 比 实际 小 了 很 多 。 

带 有 很 大 的 整数 部 分 或 很 小 的 小 数 部 分 的 实数 不 应 该 用 定点 表示 法 存储 。 

1. 浮 点 表示 法 

用 于 维持 正确 度 或 精度 的 解决 方法 是 使 用 浮 点 表示 法 。 该 表示 法 允许 小 数 点 浮动 : 我 们 
可 以 在 小 数 点 的 左右 有 不 同 数量 的 数码 。 使 用 这 种 方法 极 大 地 增加 了 可 存储 的 实数 范围 ， 带 
有 很 大 的 整数 部 分 或 很 小 的 小 数 部 分 的 实数 可 以 存储 在 内 存 中 了 。 在 浮 点 表示 法 中 ， 无 论 十 
进 制 还 是 二 进 制 ， 一 个 数字 都 由 3 部 分 组 成 ， 如 图 3-10 所 示 。 

第 一 部 分 是 符号 ， 可 正 可 负 。 第 二 部 分 
显示 小 数 点 应 该 左右 移动 构成 实际 数字 的 位 es 
移 量 。 第 三 部 分 是 小 数 点 位 置 固定 的 定点 表 浮 点 表示 法 








示 法 。 图 3-10 在 浮 点 表示 法 中 的 实数 的 3 个 部 分 
一 个 数字 的 浮 点 表示 法 由 3 部 分 组 成 : 符号 、 位 移 量 和 定点 数 。 
浮 点 表示 法 在 科学 中 用 于 表示 很 小 或 很 大 的 十 进 制 数 。 在 称 作 科学 计数 法 的 表示 法 中 ， 


定点 部 分 在 小 数 点 左边 只 有 1 个 数码 而 且 位 移 量 是 10 的 寡 次 。 

例 3.18 下面 演 示 用 科学 计数 法 ( 浮 点 表示 法 ) 表示 的 十 进 制 数 7425 000 000 000 000 000000.00。 

解 

实际 数字 一 + 7425 000 000 000 000 000 000.00 

科学 计数 法 一 + 7.425 x 1021 

这 三 部 分 为 符号 (+)、 位 移 量 (21 ) 以 及 定点 部 分 (7.425 )。 注 意 那 个 位 移 量 就 是 指 
数 。 这 种 表示 法 的 好 处 显而易见 。 即 使 在 一 张 纸 上 写 数字 ， 科 学 计数 法 也 是 更 短 并 更 省 空 
间 。 这 种 计数 法 使 用 了 浮 点 表示 法 的 概念 ， 因 为 那个 靠近 例题 右 下 方 的 小 数 点 位 置 已 经 向 左 
移 了 21 位 形成 该 数字 的 定点 部 分 。 一 些 程序 设计 语言 和 计算 器 按照 +7.425E21 来 显示 该 数 
字 ， 因 为 以 10 为 底 是 不 言 而 喻 的 。 
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例 3.19 用 科学 计数 法 表示 数字 -0.000 000 000 000 023 2。 
解 ”使 用 前 例 同样 的 方法 ， 将 小 数 点 移 到 数码 2 之 后 ， 如 下 所 示 : 
实际 数字 一 - 0.000 000 000 000 023 2 
科学 计数 法 一 - 2.32x10-1 
注意 这 里 指数 是 负 的 ， 因 为 小 数 点 需要 左 移 ( 14 位 ) 来 构成 原 数 字 。 我 们 可 再 次 说 该 计 
数 法 中 的 数字 由 3 部 分 组 成 : 符号 ( -)、 实 数 (2.32 ) 以 及 负 整 数 ( -14 )。 一 些 程序 设计 语 
言 和 计算 器 按照 -2.32E-14 来 显示 该 数字 。 
类 似 方法 可 用 于 表示 很 小 或 很 大 的 存储 于 计算 机 中 的 二 进 制 数字 (整数 和 实数 丝 可 )。 
例 3.20 用 浮 点 格式 表示 数字 (101001000000000000000000000000000.00)2。 
解 ”使 用 前 例 同 样 的 方法 ， 小 数 点 前 只 保留 一 位 数字 ， 如 下 所 示 : 
实际 数字 一 + (101001000000000000000000000000000.00); 
科学 计数 法 一 + 1.01001 x 232 
注意 我 们 不 必 担 心 从 最 右边 的 1 开始 的 右 侧 的 那些 0， 这 是 因为 当 我 们 使 用 实数 
(1.01001);: 时 它们 并 不 重要 。 指 数 显示 为 32， 但 它 实 际 上 以 二 进 制 存 储 在 计算 机 中 ， 正 如 不 
久 我 们 要 看 到 的 那样 。 我 们 也 已 经 显示 符号 为 正 ， 但 它 可 能 作为 1 位 存储 。 
例 3.21 用 浮 点 格式 表示 数字 -(0.00000000000000000000000101)>。 
解 ”使 用 前 例 同样 的 方法 ， 小 数 点 左边 只 留 一 个 非 零 数 码 : 
实际 数字 一 - (0.00000000000000000000000101); 
科学 计数 法 一 - 1.01x2* 
注意 指数 作为 负 的 二 进 制 数 存 储 在 计算 机 中 。 
2. 规范 化 
为 了 使 表示 法 的 固定 部 分 统一 ， 科 学 计数 法 (用 于 十 进 制 ) 和 浮 点 表示 法 (用 于 二 进 制 ) 
都 在 小 数 点 左边 使 用 了 唯一 的 非 零 数码 ， 这 称 为 规范 化 。 十 进 制 系统 中 的 数码 可 能 是 1 一 9， 
而 二 进 制 系统 中 该 数码 是 1。 在 下 面 ，d 是 非 零 数 码 ，x 是 一 个 数码 ,是 0 或 1。 
十 进 制 一 土 d.xxxxxxxxxxxxxx 注意: dg 是 1 一 9， 每 个 x 是 0 一 9 
二 进 制 一 + 1.yyyyyyyyyyyyyy 注意 : 每 个 y 是 0 或 1 
3. 符号 、 指 数 和 尾数 
在 一 个 二 进 制 数 规范 化 之 后 ， 我 们 只 存储 了 一 个 数 的 三 部 分 信息 : 符号 、 指 数 和 尾数 
(小 数 点 右边 的 位 )。 例 如 ，+1000111.0101 规范 化 后 变 成 为 : 
符号 ”指数 尾数 
4 26 x 1.0001110101 
+ 6 0001110101 
注意 小 数 点 和 定点 部 分 左边 的 位 1 并 没有 存储 ,它们 是 隐 合 的 。 
(1) 符号 
一 个 数 的 符号 可 以 用 一 个 二 进 制 位 来 存储 (0 或 1 )。 
(2 ) 指数 
指数 (2 的 寡 ) 定义 为 小 数 点 移动 的 位 数 。 注 意 寡 可 以 为 正 也 可 以 为 负 。 余 码 表示 法 
(后 面 讨 论 ) 是 用 来 存储 指数 位 的 方法 。 
(3 ) 尾数 
尾数 是 指 小 数 点 右边 的 二 进 制 数 。 它 定义 了 该 数 的 精度 。 尾 数 是 作为 无 符号 整数 存储 
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的 。 如 果 我 们 把 尾数 和 符号 一 起 考虑 ， 则 可 以 说 这 个 组 合 是 作为 符号 加 绝对 值 格式 的 整数 存 
储 的 。 但 是 ， 我 们 需要 记 住 它 不 是 整数 ， 而 是 像 整 数 那样 存储 的 小 数 部 分 。 我 们 强调 这 一 点 
是 因为 在 尾数 中 ， 如 果 在 数字 的 右边 插入 多 余 的 零 ， 这 个 值 将 会 改变 ， 而 在 一 个 真正 的 整数 
中 ， 如 果 在 数字 的 左边 插入 多 余 的 零 ， 这 个 值 是 不 会 改变 的 。 

尾数 是 带 符号 的 小 数 部 分 ， 像 以 符号 加 绝对 值 表示 法 存储 的 整数 天 

4. 余 码 系统 

尾数 可 以 作为 无 符号 数 存 储 。 指 数 ( 即 显示 多 少 位 小 数 点 应 该 左 移 或 右 移 的 短 次 ) 是 有 
符号 的 数 。 尽 管 这 可 以 用 二 进 制 补 码 表示 法 来 存储 ， 但 被 一 种 称 为 余 码 系统 的 新 的 表示 法 取 
而 代 之 。 在 该 余 码 系统 中 ， 正 的 和 负 的 整数 都 可 以 作为 无 符号 数 存储 。 为 了 表示 正 的 或 负 的 
整数 ， 一 个 正 整数 ( 称 为 一 个 偏 移 量 ) 加 到 每 个 数字 中 ， 将 它们 统一 移 到 非 负 的 一 边 。 这 个 
偏 移 量 的 值 是 2"!-1，m 是 内 存单 元 存储 指数 的 大 小 。 

例 3.22 我 们 可 以 用 4 位 存储 单元 在 数字 系统 中 表示 16 个 整数 。 使 用 一 个 单元 作为 0， 分 
开 其 他 15 个 (不 等 地 ) 我 们 可 以 在 -7 ~ 8 的 范围 中 表示 整数 ， 如 图 3-11 所 示 。 在 该 范围 中 增 
加 7 个 单位 到 每 个 整数 中 ， 可 以 统一 把 所 有 整数 向 右 移 ， 使 其 均 为 整数 而 无 需 改 变 这 些 整 数 的 
相对 位 置 ， 避 免 了 相互 调整 ， 如 图 3-11 所 示 。 新 系统 称 为 余 7， 或 者 偏 移 量 为 7 的 偏 移 表 示 法 。 





样 对 待 。 


带 正 负 整 数 的 4 位 系统 





012345678 9101112131415 
图 3-11 余 码 表示 法 中 的 移 位 


这 种 新 的 表示 法 与 移 位 前 的 表示 法 相 比 ， 其 优点 在 于 在 余 码 系统 中 的 所 有 整数 都 是 正 
数 ， 当 我 们 对 这 些 整 数 进 行 比较 或 运算 时 不 需要 考虑 符号 。 对 于 4 位 存储 单元 ， 如 我 们 希望 
的 那样 ， 偏 移 量 是 2 一 -1=7。 

5. IEEE 标准 

电气 和 电子 工程 师 协 会 (IEEE) 已 定义 了 几 种 存储 浮 点 数 的 标准 。 这 里 我 们 讨论 其 中 两 
种 最 常用 的 一 一 单 精度 和 双 精 度 。 该 格式 如 图 3-12 所 示 。 方 框 上 方 的 数 就 是 每 一 项 的 位 数 。 
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a) 单 精度 ( 32 位 ) 








b) 双 精 度 ( 64 位 ) 
图 3-12 浮 点 数 表示 法 的 IEEE 标准 


单 精 度数 格式 采用 总 共 32 位 来 存储 一 个 浮 点 表示 法 的 实数 。 符 号 占用 1 位 (0 为 正 ，1 
为 负 )， 指 数 占 用 8 位 (使 用 偏 移 量 127 )， 尾 数 使 用 23 位 (无 符号 数 )。 该 标准 有 时 称 为 余 
127 码 (Excess_127 )， 因 为 偏 移 量 是 127。 


38 甸 了 募 





双 精 度数 格式 采用 总 共 64 位 来 存储 一 个 浮 点 表示 法 的 实数 。 符 号 占用 1 位 (0 为 正 ，! 
为 负 )， 指 数 占用 11 位 (使 用 偏 移 量 1023 )， 尾 数 使 用 52 位 。 该 标准 有 时 称 为 余 1023 码 
(Excess_1023 )， 因 为 偏 移 量 是 1023。 表 3-2 总 结 了 这 两 种 标准 的 规格 。 

和 表 3-2 两 种 IEEE 浮 点 标准 的 规格 

参照 图 3-12， 使 用 以 下 步骤 ， 一 个 实数 
可 以 存储 为 IEEE 标准 浮 点 数 格式 : 

1 ) 在 S 中 存储 符号 (0 或 1 )。 

2 ) 将 数字 转换 为 二 进 制 。 

3 ) 规范 化 。 

4) 找到 E 和 M 的 值 。 

5 ) 连接 S、E 和 M。 

例 3.23 写 出 十 进 制 数 5.75 的 余 127 码 
( 单 精度 ) 表示 法 。 

解 

1 ) 符号 为 正 ， 所 以 S=0。 

2 ) 十 进 制 转换 为 二 进 制 : 5.75=(101.11):。 

3 ) 规范 化 : (101.11)s=(1.0111), x 2?。 

4 ) E=2+127=129=(10000001)，M=(0111)>。 我 们 需要 在 M 的 右边 增加 19 个 0 使 之 成 
为 23 位 。 

5 ) 该 表示 法 如 下 所 示 

S E M 
0 10000001 01110000000000000000000 

存储 在 计算 机 中 的 数字 是 01000000101110000000000000000000。 

例 3.24 写 出 十 进 制 数 -161.875 的 余 127 码 ( 单 精度 ) 表示 法 。 

解 

1 ) 符号 为 负 ， 所 以 S=1。. 

2 ) 十 进 制 转换 为 二 进 制 : 161.875=(10100001.111)2。 

3 ) 规范 化 : (10100001.111):= (1.0100001111): x 27。 

4 ) E=7+127=134= (10000110)， 而 M= (0100001111):。 

5 ) 该 表示 法 如 下 所 示 : 

S E M 
1 10000110 01000011110000000000000 

存储 在 计算 机 中 的 数字 是 11000011010000111100000000000000。 

例 3.25 写 出 十 进 制 数 -0.023 437 5 的 余 127 码 ( 单 精度 ) 表示 法 。 

解 

1 ) S=1 (该 数 为 负 )。 

2 ) 十 进 制 转换 为 二 进 制 : 0.023 437 5= (0.0000011):。 

3 ) 规范 化 : (0.0000011)s= (1.1), x 2-。 

4) E=-6+127=121= (01111001),, M= (1)26 

5 ) 该 表示 法 如 下 所 示 : 


1023 
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S E M 
1 01111001 10000000000000000000000 
存储 在 计算 机 中 的 数字 是 10111100110000000000000000000000。 
7. 将 存储 为 IEEE 标准 浮 点 数 的 数字 还 原 
一 个 以 IEEE 浮 点 格式 之 一 存储 的 数字 可 以 用 以 下 步骤 方法 还 原 : 
1 ) 找到 S、E 和 M 的 值 。 
2 ) 如 果 S=0， 将 符号 设 为 正 号 ， 否 则 设 为 负 号 。 
3 ) 找到 位 移 量 (E-127 ) 。 
4 ) 对 尾数 去 规范 化 。 
5 ) 将 去 规范 化 的 数字 变 为 二 进 制 以 求 出 绝对 值 。 
6 ) 加 上 符号 。 
例 3.26 位 模式 (11001010000000000111000100001111); 以 余 127 码 格式 存储 于 内 存 


中 ， 求 该 数字 十 进 制 计数 法 的 值 。 
解 
1 ) 首位 表示 S$， 后 8 位 是 E， 剩 下 23 位 是 M。 
S E M 
1 10010100 00000000111000100001111 
2 ) 符号 为 负 号 。 


3 ) 位 移 量 =E-127=148-127=21。 
4) 将 (1.00000000111000100001111); x 22 去 规范 化 。 
5 ) 二 进 制 数 是 (1000000001110001000011.11)2。 
6 ) 绝对 值 是 2 104 378.75。 
7 ) 该 数字 是 -2 104 378.75。 
8. 上 溢 和 下 滋 
对 于 浮 点 数 ， 有 上 溢 和 下 滋 两 种 情况 。 图 3-13 显示 了 使 用 32 位 内 存单 元 ( 余 127 码 ) 
的 浮 点 表示 法 范围 。 该 表示 法 不 能 存储 很 小 或 很 大 的 绝对 值 。 试 图 存储 绝对 值 很 小 的 数 导致 
下 滋 的 情况 ， 而 试图 存储 绝对 值 很 大 的 数 导致 上 溢 的 情况 。 我 们 把 临界 值 (+ 最 大 值 ，- 最 
大 值 ，+ 最 小 值 ，- 最 小 值 ) 的 计算 留 作 练习 。 
-最 大 : - (1-2*) x 2*28 + 最 大 : + (1-2*) x2"* 
-最 小 : - (1-2- ) x2-27 + 最 小 : + (1-2-1) x2-2 





-最 大 -最 小 ”0 + 最 小 + 最 大 
图 3-13 ”实数 的 浮 点 表示 法 中 的 上 溢 和 下 海 


9. 存储 零 

你 可 能 注意 到 带 有 整数 部 分 和 小 数 部 分 的 实数 设置 为 零 的 时 候 是 0.0， 无 法 用 以 上 讨论 
的 步 又 存储 。 为 了 处 理 这 个 特例 ， 约 定 在 这 种 情况 下 符号 、 指 数 和 尾数 都 设 为 零 。 

10. 截断 错误 

当 使 用 浮 点 表示 法 存储 实数 时 ， 存 储 数字 的 值 可 能 不 是 我 们 希望 的 。 例 如 ， 假 定 我 们 需 
要 在 内 存 中 用 余 127 码 表示 法 存储 这 个 数字 : 
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(1111111111111111.11111111111)， 

规范 化 之 后 得 到 : 

(1.11111111111111111111111111); 

这 意味 着 尾数 有 26 个 1。 这 个 尾数 需要 截 短 为 23 个 1， 换 言 之， 存储 在 计算 机 中 的 是 : 

(1.11111111111111111111111) 原来 的 数 变 为 : ) 

(1111111111111111.11111111); 

小 数 部 分 右边 的 3 个 1 被 截 掉 了 。 这 种 原始 数字 与 还 原 后 数字 的 差异 称 为 截断 错误 。 在 
使 用 很 小 或 很 大 数字 的 地 方 ， 如 宇航 业 的 计算 中 ， 这 种 类 型 的 错误 是 很 严重 的 。 这 种 情况 下 ， 
我 们 需要 更 大 的 内 存单 元 和 其 他 的 表示 法 。 为 此 ，IEEE 定义 了 用 于 更 大 尾数 的 其 他 表示 法 。 


3.3 ”存储 文本 


在 任何 语言 中 ， 文 本 的 片断 是 用 来 表示 该 语言 中 某 个 意思 的 一 系列 的 符号 。 例 如 ， 在 英 
语 中 使 用 26 个 符号 (A，B，C，…，Z) 来 表示 大 写字 母 ，26 个 符号 (a，b，c，…，z) 表 
示 小 写字 母 ，10 个 符号 (0，1，2，…，9 ) 来 表示 数字 字符 (不 是 实际 的 数字 ; 后 面 将 看 到 
它们 的 不 同 之 处 )， 以 及 符号 (.，?，:，; ，...，! ) 来 表示 标点 。 另 外 一 些 符号 (如 空格 、 换 
行 和 制 表 符 ) 被 用 于 文本 的 对 齐 和 可 读 性 。 

我 们 可 用 位 模式 来 表示 任何 一 个 符号 。 换 名 话说 ， 如 4 个 符号 组 成 的 文本 “CATS” 人 能 
用 4 个 n 位 模式 表示 ， 任 何 一 个 模式 定义 一 个 单独 
的 符号 (图 3-14 )。 

现在 的 问题 是 : 在 一 种 语言 中 ， 位 模式 到 底 需 本 
要 多 少 位 来 表示 一 个 符号 ? 这 主要 取决 于 该 语言 集 图 214 利用 位 淆 直 站 入 全 呈 
中 到 底 有 多 少 不 同 的 符号 。 例 如 ， 如 果 要 创建 的 某 个 虚构 的 语言 仅仅 使 用 大 写 英文 字母 ， 则 
只 需要 26 个 符号 。 相 应 地 ， 这 种 语言 的 位 模式 至 少 需 要 表示 26 个 符号 。 

对 另 一 种 语言 ， 如 中 文 ， 可 能 需要 更 多 的 符号 。 在 一 种 语言 中 ， 表 示 某 一 符号 的 位 模式 
的 长 度 取决 于 该 语言 中 所 使 用 的 符号 的 数量 。 更 多 的 符号 意味 着 更 长 的 位 模式 。 

尽管 位 模式 的 长 度 取决 于 符号 的 数量 ， 但 是 它们 的 关系 并 不 是 线性 的 ， 而 是 对 数 的 。 
如 果 需 要 2 个 符号 ， 位 模式 长 度 将 是 1 位 (1og22=1 )， 如 果 需 要 4 个 符号 ， 长 度 将 是 2 位 
(logz4=2 )。 从 表 3-3 中 可 以 很 容易 看 出 它们 之 间 的 关系 。2 位 的 位 模式 能 表示 4 种 不 同 的 形 
式 : 00，01，10 和 11。 这 些 形式 中 的 任何 一 种 都 可 用 来 代表 一 个 字符 。 同 样 ，3 位 的 位 模 
式 有 8 种 不 同 的 形式 : 000，001，010，011，100，101，110 和 111。 


表 3-3 符号 数量 和 位 模式 长 度 的 关系 








了 pg 二 
1000011 有 W10000011I101010041010011 


4 4 294 967 296 





不 同 的 位 模式 集合 被 设计 用 于 表示 文本 符号 。 其 中 每 一 个 集合 我 们 称 之 为 代码 。 表 示 符 
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号 的 过 程 被 称 为 编码 。 在 这 个 部 分 将 介绍 常用 代码 。 

1.ASCII 

美国 国家 标准 协会 (ANSI) 开发 了 一 个 被 称 为 美国 信息 交换 标准 码 (ASCII) 的 代码 。 
该 代码 使 用 7 位 表示 每 个 符号 。 即 该 代码 可 以 定义 27"=128 种 不 同 的 符号 。 用 于 表示 ASCII 
码 的 完整 位 模式 可 见 附录 A。 如 今 ASCII 是 Unicode 的 一 部 分 ， 下 面 将 要 讨论 。 

2. Unicode 

硬件 和 软件 制造 商 联 合 起 来 共同 设计 了 一 种 名 为 Unicode 的 代码 ， 这 种 代码 使 用 32 位 
并 能 表示 最 大 达 2”=4 294 967 296 个 符号 。 代 码 的 不 同 部 分 被 分 配 用 于 表示 来 自 世 界 上 不 
同 语言 的 符号 。 其 中 还 有 些 部 分 被 用 于 表示 图 形 和 特殊 符号 。Unicode 符号 的 简 集 见 附录 A。 
如 今 ASCII 是 Unicode 的 一 部 分 。 

3. 其 他 编码 

最 近 几 十 年 来 ， 其 他 编码 不 断 发 展 。 鉴 于 Unicode 的 优势 ， 这 些 编码 变 得 不 太 流 行 。 我 
们 把 了 解 这 些 编码 作为 练习 。 


3.4 存储 音频 


音频 表示 声音 或 音乐 。 音 频 本 质 上 与 我 们 讨论 到 现在 的 数字 和 文本 是 不 同 的 。 文 本 由 可 
数 的 实体 (文字 ) 组 成 : 我 们 可 以 数 出 文本 中 文字 的 数量 。 文 本 是 数字 数据 的 一 个 例子 。 相 
反 ， 音 频 是 不 可 数 的 。 音 频 是 随时 间 变 化 的 实体 ， 我 们 只 能 在 每 一 时 刻度 量 声音 的 密度 。 当 
我 们 讨论 用 计算 机 内 存 存储 声音 时 ， 我 们 的 意思 是 存储 一 个 音频 信号 的 密度 ， 例 如 ， 每 隔 一 
段 时 间 (一 秒 钟 ， 一 小 时 ) 来 自 麦 克 风 的 信号 。 
音频 是 模拟 数据 的 例子 。 即 使 我 们 能 够 在 一 段 时 间 度 量 所 有 的 值 ， 也 不 能 把 它 全 部 存在 
计算 机 内 存 中 ， 因 为 可 能 需要 无 限 数量 的 内 存单 元 。 图 3-15 显示 了 一 个 模拟 信号 随时 间 变 
化 的 本 质 ， 如 音频 。 
值 
最 大 值 


0 Is 时 间 


最 小 值 
一 秒 钟 内 无 限 个 数量 的 值 


图 3-15 一 个 音频 信和 号 
3.4.1 采样 


如 果 我 们 不 能 记录 一 段 间 隔 的 音频 信号 的 所 有 值 ， 至 少 我 们 可 以 记录 其 中 的 一 些 。 采 样 
意味 着 我 们 在 模拟 信号 上 选择 数量 有 限 的 点 来 度量 它们 的 值 并 记录 下 来 。 图 3-16 显示 了 从 
这 样 的 信号 上 选择 10 个 样本 : 我 们 可 以 记录 这 些 值 来 表现 模拟 信号 。 





”一 秒 钟 内 的 10 个 样本 值 
图 3-16 一 个 音频 信号 的 采样 
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采样 率 

下 一 个 逻辑 问题 是 ， 我 们 每 秒 钟 需要 多 少 样本 才能 还 原 出 原始 信号 的 副本 ?样本 数 
量 依赖 于 模拟 信号 中 变化 的 最 大 数量 。 如 果 信 号 是 平坦 的 ， 则 需要 很 少 的 样本 ; 如 果 信 
号 变化 剧烈 ， 则 需要 更 多 的 样本 。 每 秒 40 000 个 样本 的 采样 率 对 音频 信号 来 说 是 足够 
好 的 。 


3.4.2 量化 


从 每 个 样本 测量 来 的 值 是 真实 的 数字 。 这 意味 着 我 们 可 能 要 为 每 一 秒 的 样本 存储 40 000 
个 真实 的 值 。 但 是 ， 为 每 个 样本 使 用 一 个 无 符号 的 数 (位 模式 ) 会 更 简便 。 量 化 指 的 是 将 样 
本 的 值 截取 为 最 接近 的 整数 值 的 一 种 过 程 。 例 如 ， 如 果实 际 的 值 为 17.2， 就 可 截取 为 17 ; 
如 果 值 为 17.7， 就 可 截取 为 18。 


3.4.3 ”编码 


下 面 的 任务 是 编码 。 量 化 的 样本 值 需要 被 编码 成 位 模式 。 一 些 系统 为 样本 赋 正 值 或 负 
值 ， 另 一 些 仅仅 移动 曲线 到 正 的 区 间 从 而 只 赋 正 值 。 换 言 之 ， 一 些 系统 使 用 无 符号 整数 来 表 
示 样 本 ， 而 另 一 些 使 用 有 符号 的 整数 来 做 。 但 是 ， 有 符号 的 整数 不 必用 在 二 进 制 补 码 中 ， 它 
们 可 以 是 符号 加 绝对 值 的 值 。 最 左边 的 位 用 于 表示 符号 (0 表示 正 值 ，1 表示 负 值 )， 其 余 的 
位 用 于 表示 绝对 值 。 

1. 每 样本 位 

对 于 每 个 样本 系统 需要 决定 分 配 多 少 位 。 尽 管 在 过 去 仅 有 8 位 分 配给 声音 样本 ， 现 在 每 
样本 16、24 甚至 32 位 都 是 正常 的 。 每 样本 位 的 数量 有 时 称 为 位 深度 。 

2. 位 率 

如 果 我 们 称 位 深度 或 每 样本 位 的 数量 为 B， 每 秒 样本 数 为 S$， 我 们 需要 为 每 秒 的 音频 存 
储 Sx8B 位 。 该 乘积 有 时 称 为 位 率 R。 例 如 ， 如 果 我 们 使 用 每 秒 40 000 个 样本 以 及 每 样本 16 
位 ， 位 率 是 R=40 000 x 16=640 000 b/s=640 KB/s。 


3.4.4 声音 编码 标准 


当今 音频 编码 的 主流 标准 是 MP3 (MPEG Layer 3 的 简写 ) 。 该 标准 是 用 于 视频 压缩 方法 
的 MPEG (动态 图 像 专家 组 ) 标准 的 一 个 修改 版 。 它 采用 每 秒 44 100 个 样本 以 及 每 样本 16 
位 。 结 果 信 和 号 达到 705 600 b/s 的 位 率 ， 再 用 去 掉 那 些 人 耳 无 法 识别 的 信息 的 压缩 方法 进行 
压缩 。 这 是 一 种 有 损 压 缩 法 ， 与 无 损 压 缩 法 相反 ， 参 见 第 15 章 。 


3.5 “存储 图 像 
存储 在 计算 机 中 的 图 像 使 用 两 种 不 同 的 技术 : 光栅 图 或 拓 量 图 。 


3.5.1 光栅 图 


当 我 们 需要 存储 模拟 图 像 (如 照片 ) 时 ， 就 用 到 了 光栅 图 (或 位 图 )。 一 张 照片 由 模拟 数 
据 组 成 ， 类 似 于 音频 信息 。 不 同 的 是 数据 密度 〈 色 彩 ) 因 空 间 变化 ， 而 不 是 因 时 间 变 化 。 这 
意味 着 数据 需要 采样 。 然 而 ， 这 种 情况 下 采样 通常 被 称 作 扫描 。 样 本 称 为 像素 (代表 图 像 元 
素 )。 换 言 之 ， 整 个 图 像 被 分 成 小 的 像素 ， 每 个 像素 假定 有 单独 的 密度 值 。 
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1. 解析 度 

就 像 音频 采样 那样 ， 在 图 像 扫描 中 ， 我 们 要 决定 对 于 每 英寸 的 方块 或 线条 需要 记录 多 少 
像素 。 在 图 像 处 理 中 的 扫描 率 称 为 解析 度 。 如 果 解 析 率 足够 高 ， 人 眼 不 会 看 出 在 重 现 图 像 中 
的 不 连续 。 

2. 色彩 深度 

用 于 表现 像素 的 位 的 数量 ， 即 色彩 深度 ,依赖 于 像素 的 颜色 是 如 何 由 不 同 的 编码 技术 
来 处 理 的 。 对 颜色 的 感觉 是 我 们 的 眼睛 如 何 对 光线 的 响应 。 我 们 的 眼睛 有 不 同类 型 的 感光 细 
胞 : 一 些 响应 红 、 黄 、 蓝 三 原色 (也 叫 RGB )， 而 另 一 些 仅仅 响应 光 的 密度 。 

(1 ) 真 彩色 

用 于 像素 编码 的 技术 之 一 称 为 真 彩 色 ， 它 使 用 24 位 来 编码 一 个 像素 。 在 该 技术 中 ， 每 个 
三 原色 (RGB) 都 表示 为 8 位 。 因 为 该 技术 中 8 位 模式 可 以 表示 0 ~ 255 之 间 的 一 个 数 ， 所 以 
每 种 色彩 都 由 0 ~ 255 之 间 的 三 维 数字 表示 。 表 3-4 显示 了 该 技术 中 用 于 一 些 颜 色 的 3 个 值 。 


表 3-4 ”定义 为 真 彩色 的 一 些 颜色 





注意 : 真 彩色 模式 可 以 编码 234 或 16 777 216 种 颜色 。 换 言 之 ， 各 个 像素 的 色彩 深度 是 
这 些 值 的 其 中 之 一 。 

(2 ) 索引 色 

真 彩 色 模 式 使 用 了 超过 1600 万 种 的 颜色 。 许 多 应 用 程序 不 需要 如 此 大 的 颜色 范围 。 索 
引 色 (或 调 色 板 色 ) 模式 仅 使 用 其 中 的 一 部 分 。 在 该 模式 中 ， 每 个 应 用 程序 从 大 的 色彩 集中 
选择 一 些 颜色 (通常 是 256 种 ) 并 对 其 建立 索引 。 对 选中 的 颜色 赋 一 个 0 ~ 255 之 间 的 值 。 
这 就 类 似 艺术 家 可 能 在 他 们 的 画室 用 到 很 多 种 颜色 ， 但 一 次 
仅 用 到 他 们 调 色 板 中 的 一 些 。 Te 9 

3-17 示意 了 索引 色 的 思路 。 于 蜂 测 

对 索引 的 使 用 减少 了 需要 存储 一 个 像素 所 需要 的 位 的 数 
量 。 例 如 ， 真 彩 模式 需要 24 位 来 储存 一 个 像素 ,索引 色 模 [3 引 一 | 、 
式 通常 使 用 256 个 索引 ， 这 需要 8 位 来 存储 同样 的 像素 。 例 “索引 
如 ， 一 部 高 质量 的 数码 相机 要 用 几乎 3 百 万 像素 拍摄 一 张 。 
3X5 英寸 的 相片 。 以 下 显示 使 用 各 种 模式 存储 所 需要 的 位 ”图 3-17 索引 色 5 真 彩色 的 关系 


的 数量 。 
真 彩色 : 3000000 x 24 = 72000000 
索引 色 : 3000000 x 8 = 24000000 
3. 图像 编码 标准 


几 种 用 于 图 像 编码 的 实际 标准 正在 使 用 中 。JPEG (联合 图 像 专家 组 ) 使 用 真 彩色 模式 ， 
但 压缩 图 像 来 减少 位 的 数量 (参见 第 15 章 )。 另 一 方面 ，GIF (图 形 交 换 格式 ) 使 用 索引 色 
模式 。 


3.5.2 ”矢量 图 


光栅 图 有 两 个 缺点 ， 即 文件 体积 太 大 和 重新 调整 图 像 大 小 有 麻烦 。 放 大 光栅 图 像 意 味 着 
扩大 像素 ， 所 以 放大 后 的 图 像 看 上 去 很 粗糙 。 但 是 ， 矢 量 图 图 像 编码 方法 并 不 存储 每 个 像素 
的 位 模式 。 一 个 图 像 被 分 解 成 几何 图 形 的 组 合 ， 例 如 ， 线 段 、 和 矩形 或 圆 形 。 每 个 几何 形状 由 
数学 公式 表达 。 例 如 ， 线 段 可 以 由 它 端点 的 坐标 描述 ， 圆 可 以 由 它 的 圆心 坐标 和 半径 长 度 来 
描述 。 矢 量 图 是 由 定义 如 何 绘制 这 些 形状 的 一 系列 命令 构成 的 。 

当 要 显示 或 打印 图 像 时 ,将 图 像 的 尺寸 作为 输入 传 给 系统 。 系 统 重新 设计 图 像 的 大 小 并 
用 相同 的 公式 画 出 图 像 。 在 这 种 情况 下 ， 每 一 次 绘制 图 像 ， 公 式 也 将 重新 估算 一 次 。 因 此 ， 
矢量 图 也 称 为 几何 模型 或 面向 对 象 图 形 。 

例如 ， 考 虑 半径 为 > 的 圆 形 。 程 序 需要 绘制 该 圆 的 主要 信息 如 下 : 

e 一 个 圆 的 半径 r。 

e 圆心 的 位 置 。 

e 绘制 的 线 型 和 颜色 。 

e 填充 的 类 型 和 颜色 。 

当 该 圆 的 大 小 改变 时 ， 程 序 改 变 半径 的 值 并 重新 计算 这 些 信息 以 便 再 绘制 一 个 圆 。 改 变 
图 像 大 小 不 会 改变 绘图 的 质量 。 

矢量 图 不 适合 存储 照片 图 像 的 细微 精妙 。JPEG 或 GIF 光栅 图 提供 了 更 好 和 更 生动 的 图 
片 。 矢 量 图 适合 应 用 程序 采用 主要 的 几何 元 素来 创建 图 像 。 它 用 于 诸如 Flash 这 样 的 应 用 程 
序 ， 以 及 创建 TrueType (微软 、 苹 果 公 司 ) 和 PostScript (Adobe 公司 ) 字体 。 计 算 机 辅助 设 
计 (CAD) 也 使 用 矢量 图 进行 工程 绘图 。 


3.6 ”存储 视频 


视频 是 图 像 ( 称 为 帧 ) 在 时 间 上 的 表示 。 一 部 电影 就 是 一 系列 的 帧 一 张 接 一 张 地 播放 而 
形成 运动 的 图 像 。 换 言 之 ， 视 频 是 随 空间 (单个 图 像 ) 和 时 间 (一 系列 图 像 ) 变化 的 信息 表 
现 。 所 以 ， 如 果 知 道 如 何 将 一 幅 图 像 存储 在 计算 机 中 ， 我 们 也 就 知道 如 何 储存 视频 ; 每 一 幅 
图 像 或 帧 转化 成 一 系列 位 模式 并 储存 。 这 些 图 像 组 合 起 来 就 可 表示 视频 。 需 要 注意 现在 视频 
通常 是 被 压缩 存储 的 。 在 第 15 章 ， 我 们 将 讨论 MPEG ， 这 是 一 种 常见 的 视频 压缩 技术 。 


3.7 ” 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
® Halsall, F. Multimedia Communication, Boston, MA: Addison Wesley, 2001 
Koren, I. Computer Arithmetic Algorithms, Natick, MA: A K Peters, 2001 
Long, B. Complete Digital Photography, Hignham, MA: Charles river Media, 2000 


Mano, M. Computer System Architecture, Upper Saddle River, NJ: Prentice Hall, 1993 
Miano, J. Compressed Image File Formats, Boston, MA: Addison Wesley, 1999 


小 结 


数据 以 不 同 的 形式 出 现 ， 包 括 数 字 、 文 本 、 音 频 、 图 像 和 视频 。 所 有 的 数据 类 型 都 
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转换 为 称 为 位 模式 的 统一 表现 形式 。 

数字 在 存储 到 计算 机 内 存 中 之 前 被 转换 成 二 进 制 系统 。 有 数 种 方法 来 处 理 符号 。 有 
两 种 方法 来 处 理 小 数 点 : 定点 和 浮 点 。 整 数 可 以 被 当 作 小 数 点 位 置 固 定 的 数字 : 小 
数 点 固定 在 最 右边 一 位 。 无 符号 整数 是 永远 不 会 为 负 的 整数 。 存 储 有 符号 整数 的 方 
法 之 一 是 符号 加 绝对 值 格式 。 这 种 格式 中 ， 最 左 位 用 于 显示 符号 且 其 余 位 定义 绝对 
值 。 符 号 和 绝对 值 互 相 分 开 。 几 乎 所 有 的 计算 机 都 使 用 二 进 制 补 码 表 示 法 来 存储 位 
于 位 存储 单元 中 的 有 符号 整数 。 该 方法 中 ， 无 符号 整数 的 有 效 范围 被 分 为 两 个 相 
等 的 子 范围 。 第 一 个 子 范围 用 来 表示 非 负 整数 ， 第 二 个 子 范围 用 于 表示 负 整 数 。 在 
二 进 制 补 码 表示 法 中 ， 最 左 位 决定 整数 的 符号 。 但 符号 和 绝对 值 互 相 分 开 。 实 数 是 
带 有 整数 部 分 和 小 数 部 分 的 数字 。 实 数 使 用 浮 点 表示 法 存储 在 计算 机 中 。 一 个 数字 
在 浮 点 表示 法 中 由 三 部 分 组 成 : 符号 、 位 移 量 和 定点 数 。 

文本 的 片断 是 用 来 表示 该 语言 中 某 个 意思 的 一 系列 的 符号 。 我 们 可 用 位 模式 来 表示 
每 一 个 符号 。 不 同 的 位 模式 (代码 ) 集合 被 设计 用 于 表示 文本 符号 。 硬 件 和 软件 制 
造 商 联 合 起 来 共同 设计 了 一 种 名 为 Unicode 的 代码 ， 这 种 代码 使 用 32 位 表示 一 个 
符号 。 

音频 表示 声音 或 音乐 。 音 频 是 模拟 数据 。 我 们 不 能 够 在 一 段 时 间 记 录 无 限 数量 的 值 ， 
我 们 只 能 记录 一 些 样 本 。 样 本 数量 依赖 于 模拟 信号 中 变化 的 最 大 数量 。 从 每 个 样本 
测量 来 的 值 是 真实 的 数字 。 量 化 指 的 是 将 样本 的 值 截 取 为 最 接近 的 整数 值 的 一 种 
过 程 。 

存储 在 计算 机 中 的 图 像 使 用 两 种 不 同 的 技术 : 光栅 图 或 矢量 图 。 当 需要 存储 模拟 图 
像 (如 照片 ) 时 ， 就 用 到 了 光栅 图 。 图 像 被 扫描 (采样 ) 然后 存储 像素 。 用 矢量 图 图 
像 的 方法 ,一 个 图 像 被 分 解 成 几何 图 形 的 组 合 ， 例 如 ， 线段、 矩形 或 圆 形 。 每 个 几 
何 形状 由 数学 公式 表达 。 

视频 是 图 像 〈( 称 为 帧 ) 在 时 间 上 的 表示 。 一 部 电影 就 是 一 系列 的 帧 逐个 播放 而 形成 
运动 的 图 像 。 换 言 之 ,视频 是 随 空间 (单个 图 像 ) 和 时 间 (一 系列 图 像 ) 变化 的 信息 
表现 。 


3.8 练习 


小 测验 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 测验 题 。 强 烈 建议 学 生 在 继续 本 章 习 题 前 首 
先 完成 相关 测验 题 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 说 出 5$ 种 计算 机 可 以 处 理 的 数据 。 

2. 位 模式 的 长 度 如 何 与 其 能 表示 的 符号 数量 相关 ? 

3. 位 图 方法 是 如 何以 位 模式 来 表示 一 个 图 像 的 ? 

4. 矢量 图 方法 优 于 位 图 方法 的 优点 是 什么 ? 其 缺点 又 是 什么 ? 

5. 将 音频 数据 转换 为 位 模式 需要 哪些 步骤 ? 

6. 比较 和 对 照 在 无 符号 、 符 号 加 绝对 值 以 及 二 进 制 补 码 格式 中 的 正 整数 的 表示 法 。 
7. 比较 和 对 照 在 无 符号 、 符 号 加 绝对 值 以 及 二 进 制 补 码 格式 中 的 负 整 数 的 表示 法 。 
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8. 比较 和 对 照 在 符号 加 绝对 值 、 二 进 制 补 码 格 式 和 余 码 格式 中 的 0 的 表示 法 。 
9. 讨论 在 符号 加 绝对 值 和 二 进 制 补 码 格式 中 最 左 位 扮演 的 角色 。 
10. 回答 以 下 关于 实数 浮 点 表示 法 的 问题 : 

a. 为 什么 需要 规范 化 ? 

b. 什么 是 尾数 ? 

c. 数字 在 规范 化 以 后 ， 何 种 信息 被 计算 机 存储 在 内 存 中 ? 


练习 题 


1. 我 们 可 以 有 多 少 不 同 的 5 位 模式 ? 

2. 一 些 国家 的 车 牌 有 两 个 十 进 制 数码 (0 ~ 9 )， 我 们 可 以 有 多 少 种 不 同 的 车 牌 ? 如 果 不 允 许 使 用 数码 
0， 又 会 有 多 少 种 不 同 的 车 牌 ? 

3. 用 2 个 数码 跟 3 个 大 写字 母 (A 一 Z) 的 车 牌 来 重 做 上 题 。 

4. 一 种 机 器 有 8 个 不 同 的 圈 。 为 表示 每 个 圈 需 要 多 少 位 ? 

5. 学 生 在 一 门 课程 中 的 成 绩 可 用 A、B、C、D、F、W (退学 ) 或 1 (未 完成 ) 表示 等 级 。 表 示 这 些 等 级 
需要 多 少 位 ? 

6. 一 个 公司 决定 给 每 个 员工 分 配 唯一 的 位 模式 。 如 果 该 公司 有 900 名 和 雇员， 构建 该 表示 法 的 系统 最 少 
需要 多 少 位 ? 可 分 配 多 少 位 模式 ? 如果 再 雇佣 另外 300 名 员工 ， 系 统 需 要 增加 位 数 吗 ? 说 明 答 案 。 

7. 如 果 我 们 使 用 4 位 模式 表示 0 ~ 9 的 数码 ， 将 浪费 多 少 位 模式 ? 

8. 一 个 音频 信号 每 秒 钟 采样 8000 次 ， 每 个 样本 有 256 级 不 同 的 表示 。 表 示 这 个 信号 需要 每 秒 多 


少 位 ? 
9. 将 下 列 十 进 制 数 转换 成 8 位 无 符号 整数 。 

a. 23 b. 121 c.34 d. 342 
10. 将 下 列 十 进 制 数 转换 成 16 位 无 符号 整数 。 

a.41 b. 411 c. 1234 d. 342 
11. 将 下 列 十 进 制 数 转换 成 8 位 二 进 制 补 码 表示 法 。 

a. -12 b. -145 c. 56 d. 142 
12. 将 下 列 十 进 制 数 转换 成 16 位 二 进 制 补 码 表示 法 。 

a. 102 b. -179 c. 534 d. 62 056 
13. 将 下 列 8 位 无 符号 整数 转换 成 十 进 制 数 。 

a. 01101011 b. 10010100 c. 00000110 d. 01010000 
14. 将 下 列 8 位 二 进 制 补 码 表 示 的 整数 转换 成 十 进 制 数 。 

a. 01110111 b. 11111100 c. 01110100 d. 11001110 
15. 下 面 是 一 些 二 进 制 补 码 表示 的 二 进 制 数 。 请 问 如 何 改变 它们 的 正 负 。 

a. 01110111 b. 11111100 c. 01110111 d. 11001110 
16. 如 果 在 一 个 数 上 应 用 二 进 制 补 码 表示 法 转换 两 次 ， 将 会 得 到 原 数 。 在 下 面 的 数 上 试 试看 。 

a. 01110111 b. 11111100 c. 01110100 d. 11001110 
17. 将 下 面 的 二 进 制 浮 点 数 规范 化 。 在 规范 化 后 详细 指明 指数 的 值 是 多 少 。 

a. 1.10001 b.23x111.1111 

c.27x 101.110011 d. 2 x 101101.00000110011000 
18. 将 下 面 的 数 转换 成 32 位 IEEE 格式 。 

a. -20x 1.10001 b. +23x 1.111111 c. +24x 1.01110011 d. -25x 1.01101000 
19. 将 下 面 的 数 转换 成 64 位 IEEE 格式 。 

a. -20x 1.10001 b. +23x 1.111111 c. +24x 1.01110011 d. -25x1.01101000 


20. 将 下 面 的 数 转换 成 32 位 的 IEEE 形式 。 
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a. 7.1875 b. -12.640 625 c. 11.406 25 d. -0.375 

.将 下 列 8 位 符号 加 绝对 值 表示 的 整数 转换 成 十 进 制 数 。 

a. 01110111 b. 11111100 c. 01110100 d. 11001110 

将 下 列 十 进 制 数 转换 成 8 位 符号 加 绝对 值 表示 法 。 

a. 53 b. -107 c. -5 d. 154 

在 计算 机 中 表示 有 符号 数字 的 方法 之 一 是 二 进 制 反 码 。 在 这 种 表示 法 中 ， 表 示 正 数 时 我 们 将 其 直接 
存 为 二 进 制 数字 ; 表示 负数 时 ， 对 该 数字 进行 二 进 制 反 码 运算 。 将 下 列 十 进 制 数 转换 成 8 位 二 进 制 
反 码 表示 法 。 

a. 53 b. -107 c. -5 d. 154 

将 下 列 8 位 二 进 制 反 码 表示 的 数 转换 成 十 进 制 数 。 

a. 01110111 b. 11111100 c. 01110100 d. 11001110 

如 果 在 一 个 数 上 应 用 二 进 制 反 码 表示 法 转换 两 次 ， 将 会 得 到 原 数 。 在 下 面 的 数 上 试 试看 。 

a. 01110111 b. 11111100 c. 01110100 d. 11001110 

另 一 种 求 二 进 制 补 码 的 方法 是 首先 转换 成 二 进 制 反 码 表示 法 ， 然 后 把 结果 加 1 (二 进 制 加 法 在 第 4 


章 讲解 )。 试 用 两 种 方法 转换 下 面 的 数 ， 分 析 比 较 结果 。 

a. 01110111 b. 11111100 c. 01110100 d. 11001110 

. 在 十 进 制 数 中 ， 与 二 进 制 反 码 对 等 的 称 为 十 进 制 反 码 ( 1=2-1 和 9=10-1)。 对 于 nn 位 的 单元 ,我们 
用 十 进 制 反 码 表示 数字 的 范围 是 -[(10V2)-1] 到 +[(10"/2)-1]。 带 有 个 数码 的 十 进 制 反 码 数 字 通 
过 下 面 方法 获得 :如果 数字 为 正 ， 十 进 制 反 码 就 是 其 自身 ; 如 果 数 字 为 负 ， 我 们 将 每 个 数码 减 9。 
针对 3 个 数码 位 的 单元 回答 以 下 问题 : 

a. 使 用 十 进 制 反 码 可 表示 的 数字 范围 是 多 少 ? b. 该 系统 中 我 们 如 何 决定 数字 的 符号 ? 


c. 在 该 系统 中 我 们 会 有 两 个 0 吗 ? d. 如 果 c 的 答案 是 肯定 的 ， 表 示 +0 和 -0 的 是 什么 ? 
. 求 出 下 列 数 的 十 进 制 反 码 ， 假 设 只 有 3 个 数码 位 (参见 题 )。 

a. +234 b. +560 c. -125 d. -111 

.在 十 进 制 数 中 ， 与 二 进 制 补 码 对 等 的 称 为 十 进 制 补 码 (在 二 进 制 系统 中 ，2 是 底 ; 在 十 进 制 系统 中 ， 


10 是 底 )。 对 于 位 的 单元 ， 我们 用 十 进 制 补 码 表示 数 字 的 范围 是 : 
-(〈(1072 ) 到 + (1072-1 ) 
带 有 个 数码 的 十 进 制 补 码 数 字 通 过 下 面 方法 获得 : 先 求 出 该 数字 的 十 进 制 反 码 ， 接 着 给 结果 
加 1。 针 对 3 个 数码 位 的 单元 回答 以 下 问题 : 
a. 使 用 十 进 制 补 码 可 表示 的 数字 范围 是 多 少 ? b. 该 系统 中 我 们 如 何 决定 数字 的 符号 ? 


c. 在 该 系统 中 我 们 会 有 两 个 0 吗 ? d. 如 果 c 的 答案 是 肯定 的 ， 表 示 +0 和 -0 的 是 什么 ? 
求 出 下 列 数 的 十 进 制 补 码 ， 假 设 只 有 3 个 数码 位 。 
a. +234 b. +560 c. -125 d. -111 


.在 十 六 进 制 数 中 ， 与 二 进 制 反 码 对 等 的 称 为 十 六 进 制 反 码 ( 1=2-1 和 15=16-1 )。 
a. 3 个 数码 位 使 用 十 六 进 制 反 码 可 表示 的 数字 范围 是 多 少 ? 

b. 说 明 在 十 六 进 制 系统 中 如 何 获得 十 六 进 制 反 码 ? 

c. 在 该 系统 中 我 们 会 有 两 个 0 吗 ? 

d. 如 果 c 的 答案 是 肯定 的 ， 表 示 +0 和 -0 的 是 什么 ? 

. 求 出 下 列 数 的 十 六 进 制 反 码 ， 假 设 只 有 3 个 数码 位 。 

a. +B14 b. +FE1 c. -1A d. -1E2 
在 十 六 进 制 数 中 ， 与 二 进 制 补 码 对 等 的 称 为 十 六 进 制 补 码 。 

a. 3 个 数码 位 使 用 十 六 进 制 补 码 可 表示 的 数字 范围 是 多 少 ? 

b. 说 明 在 十 六 进 制 系统 中 如 何 获得 十 六 进 制 补 码 ? 

c. 在 该 系统 中 我 们 会 有 两 个 0 吗 ? 
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d. 如 果 e 的 答案 是 肯定 的 ， 表 示 +0 和 -0 的 是 什么 ? 
34. 求 出 下 列 数 的 十 六 进 制 补 码 ， 假 设 只 有 3 个 数码 位 。 

a. +B14 b. +FE1 c.—-1A d. -1E2 
小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建 议 学 生 通 过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨论 材料 的 理解 。 
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在 第 3 章 中 ， 我 们 讲述 了 如 何在 计算 机 中 存储 不 同类 型 的 数据 。 本 章 将 讲述 如 何在 这 些 
存储 在 计算 机 中 的 数据 上 进行 运算 。 数 据 上 的 运算 可 以 分 为 三 大 类 : 算术 运算 、 移 位 运算 和 
逻辑 运算 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 列 出 在 数据 上 进行 的 三 类 运算 ; 

在 位 模式 上 进行 一 元 和 二 元 逻辑 运算 ; 

区 分 逻辑 移 位 运算 和 算术 移 位 运算 ; 

在 位 模式 上 进行 逻辑 移 位 运算 ; 

在 以 二 进 制 补 码 形式 存储 的 整数 上 进行 算术 移 位 运算 ; 

在 以 二 进 制 补 码 形式 存储 的 整数 上 进行 加 法 和 减法 运算 ; 

在 以 符号 加 绝对 值 形式 存储 的 整数 上 进行 加 法 和 减法 运算 ; 

在 以 浮 点 格式 存储 的 实数 上 进行 加 法 和 减法 运算 ; 

理解 逻辑 和 移 位 运算 的 一 些 应 用 ， 如 置 位 、 复 位 和 指定 位 的 反 转 等 。 


4.1 逻辑 运算 


在 第 3 章 中 ， 我 们 讨论 了 计算 机 中 的 数据 是 以 位 模式 存储 的 事实 。 逻 辑 运算 是 指 那些 应 
用 于 模式 中 的 一 个 二 进 制 位 ， 或 在 两 个 模式 中 相应 的 两 个 二 进 制 位 的 相同 基本 运算 。 这 意味 
着 我 们 可 以 在 位 层次 上 和 模式 层次 上 定义 逻辑 运算 。 模 式 层次 上 的 逻辑 运算 是 具有 相同 类 型 
的 位 层次 上 的 n 个 逻辑 运算 ,这 里 的 就 是 模式 中 的 位 的 数目 。 


4.1.1 位 层次 上 的 逻辑 运算 


一 个 位 可 能 是 0 或 1， 可 以 假设 “0” 代 表 逻 辑 “ 假 "， 而 “1” 代 表 逻 辑 “ 真 ”。 我 们 可 
以 应 用 布尔 代数 中 定义 的 运算 去 操纵 二 进 制 位 。 为 纪念 乔治 布尔 (George Boole) 而 命名 
的 布尔 代数 属于 逻辑 的 特殊 数学 领域 。 附 录 了 将 介绍 布尔 代数 和 它 在 建立 计算 机 中 逻辑 电 
路 中 的 应 用 。 本 节 我 们 将 简单 介绍 4 种 被 用 来 操纵 二 进 制 位 的 位 层次 上 的 运算 : 非 ( NOT)、 
与 (AND)、 或 (OR) 和 异 或 (XOR)。 

布尔 代数 和 偿 辑 电路 将 在 附录 E 中 讨论 。 a 二 

图 4-1 显示 了 这 4 种 位 层次 上 运算 的 符号 及 其 真 值 表 。 真 值 表 定义 了 对 于 每 一 种 可 能 的 
输入 的 输出 值 。 注 意 每 个 运算 符 的 输出 总 是 一 位 ， 但 输入 可 以 是 一 位 或 两 位 。 

1. 非 (NOT) 

NOT 运算 符 是 一 元 操作 符 : 它 只 有 一 个 输入 。 输 出 位 是 输入 位 的 相反 ， 如 果 输 入 是 0， 
则 输出 为 1 ; 如果 输入 为 1， 则 输出 为 0。 换 言 之，NOT 运算 符 是 输入 的 反 转 。NOT 运算 符 
的 真 值 表 只 有 两 行 ， 因 为 单个 输入 只 有 两 种 可 能 : 0 或 1。 
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NOT x 一 | 盖 x ANDy 
NOT x 
»— J —:*or, > > x XORy 
或 
图 4-1 位 层次 上 的 逻辑 运算 
2. 与 (AND) 


AND 运算 符 是 二 元 运算 符 : 它 有 两 个 输入 。 如 果 输 入 都 是 1， 则 输出 为 1， 而 在 其 他 
三 种 情况 下 ， 输 出 都 是 0。AND 运算 符 的 真 值 表 有 4 行 ， 因 为 两 个 输入 有 4 种 可 能 的 输入 
组 合 。 

特性 

AND 运算 符 有 趣 的 一 点 是 : 如 果 一 个 输入 中 有 一 位 是 0， 则 不 需要 检查 其 他 输入 中 的 
相应 的 位 ， 便 可 迅速 得 到 结果 为 0。 当 我 们 讨论 此 运算 符 在 位 模式 层次 上 的 应 用 时 ， 我 们 将 
用 到 这 个 特性 。 

对 于 x = 0 或 1 xAND0 一 0 和 0ANDx 一 0 

3. 或 (OR) 

OR 运算 符 也 是 二 元 运算 符 : 它 有 两 个 输入 。 如 果 输 入 都 是 0， 则 输出 为 0， 而 在 其 他 
三 种 情况 下 ， 输 出 都 是 1。OR 运算 符 的 真 值 表 也 有 4 行 。 OR 运算 符 有 时 称 为 包含 或 运算 符 ， 
因为 输出 值 为 1 时 ， 不 但 有 其 中 一 个 输入 为 1， 而 且 还 有 两 个 输入 都 是 1。 这 与 我 们 下 面 要 
介绍 的 运算 符 相 对 照 。 

特性 

OR 运算 符 有 趣 的 一 点 是 : 如 果 一 个 输入 中 有 一 位 是 1， 则 不 需要 检查 其 他 输入 中 的 相 
应 的 位 ， 便 可 迅速 得 到 结果 为 1。 当 我 们 讨论 此 运算 符 在 位 模式 层次 上 的 应 用 时 ， 我 们 将 用 
到 这 个 特性 。 

对 于 x 二 0 或 fxOR1 一 1 和 1ORx 一 1 .- 

4. 异 或 (XOR) 

XOR 运算 符 (发 音 为 “exclusive-or”) 像 或 运算 符 一 样 也 是 二 元 运算 符 ， 只 是 有 一 点 
不 同 : 如 果 输 入 都 是 1， 则 输出 为 0。 我们 能 用 另 一 种 方式 来 看 这 个 运算 符 : 当 输 入 相同 时 ， 
则 输出 为 0; 当 输 入 不 同时 ， 则 输出 为 1。 

例 4.1 在 英语 中 ， 我 们 使 用 连词 “或 ”时 ， 有 时 意思 是 包含 或 ， 有 时 意思 却 是 异 或 。 

a. 句子 “Iwish to have a car or a house” 使 用 的 “ or” 就 是 包含 或 的 意思 ， 我 希望 有 一 
辆 车 ， 一 栋 房 子 ， 或 二 者 兼 而 有 之 。 
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b. 句子 “ Today is either Monday or Tuesday ”使 用 的 “ or” 就 是 异 或 的 意思 ,今天 可 以 
是 星期 一 或 星期 二 ， 但 不 能 两 个 都 是 。 

例 4.2 XOR 运算 符 其 实 不 是 新 的 运算 符 ， 我 们 能 用 其 他 三 个 运算 符 来 模拟 它 。 下 面 两 
个 表达 式 是 等 价 的 。 

xzXORy +» [x AND (NOT y)] OR [(NOT x*) AND J] 

如 果 我 们 给 出 两 个 表达 式 的 真 值 表 ， 等 价 就 可 以 得 到 证 明 。 

特性 

XOR 的 特性 是 : 如 果 输 入 中 的 一 位 是 1， 那 结果 就 是 与 其 他 输入 中 相应 位 相反 。 当 我 们 
讨论 此 运算 符 在 位 模式 层次 上 的 应 用 时 ， 我 们 将 用 到 这 个 特性 。 

对 于 zx 一 0 或 1*XOR1 一 NOTx 和 xXOR1 一 NOTr 


4.1.2 ”模式 层次 上 的 逻辑 运算 


相同 的 4 个 运算 符 (NOT、AND、OR 和 XOR) 可 以 被 应 用 到 位 模式 。 效 果 就 是 对 
NOT 运算 来 说 ， 把 每 个 运算 符 应 用 于 每 个 位 ， 对 于 其 他 3 个 运算 符 就 是 把 每 个 运算 符 应 用 
于 相应 的 位 对 。 图 4-2 显示 了 带 输 入 和 输出 模式 的 4 个 运算 符 。 

7 位 n 位 7 位 m 位 nn 位 n 位 n 位 





7 位 nn 位 


图 4-2 ”应 用 于 位 模式 的 逻辑 运算 符 


例 4.3 用 NOT ( 非 ) 运算 符 来 计算 位 模式 10011000。 
解 ” 结 果 显 示 如 下 ， 注意 NOT 运算 符 把 每 个 0 变 成 1， 把 每 个 1 变 成 0。 
NOT 100 1 1000 输入 
0110011 1 输出 
例 4.4 用 AND (与 ) 运算 符 来 计算 位 模式 10011000 和 00101010。 
解 ” 结 果 显 示 如 下 ， 注意 只 有 输入 中 相应 的 位 都 为 1， 输出 中 的 位 才 为 1。 
100 1 1000 输入 1 
AND 0 0 10 10 10 输入 2 
00001000 输出 
例 4.5 对 位 模式 数值 10011001 和 00101110 应 用 OR (或 ) 运算 。 
解 ” 结 果 显 示 如 下 ， 注 意 只 有 输入 中 相应 的 位 都 为 0， 输 出 中 的 位 才 为 0。 
100 1 1001 输入 1 
OR 00 10 11 10 输入 2 
1011111 1 输出 
例 4.6 使 用 XOR ( 异 或 ) 运算 符 对 10011001 和 00101110 位 运算 。 
解 ” 结 果 显 示 如 下 ， 比 较 本 例 的 结果 与 上 例 的 结果 。 唯 一 的 不 同 是 当 输 入 中 相应 的 位 都 
为 1 时 ,输出 中 的 位 才 为 0。 
100 1 1001 输入 1 
XOR 0 0 10 1 1 1 0 输入 2 
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10 1 1 1 9111 输出 
应 用 
4 种 逻辑 运算 能 被 用 来 修改 位 模式 。 
(1) 求 反 


NOT 运算 符 的 唯一 应 用 就 是 对 整个 模式 求 反 。 对 模式 应 用 此 运算 符 把 每 个 0 变 成 1， 把 
每 个 1 变 成 0。 这 种 方式 有 时 候 也 称 为 一 个 求 反 运 算 。 例 4.3 显示 了 求 反 的 效果 。 

(2 ) 使 指定 的 位 复位 

AND 运算 的 一 个 应 用 就 是 把 一 个 位 模式 的 指定 位 复位 ( 置 0 )。 这 种 情况 下 的 第 二 个 输 
人称 为 掩 码 。 掩 码 中 的 0 位 对 第 一 个 输入 中 相应 的 位 进行 复位 。 掩 码 中 的 1 位 使 得 第 一 个 
输入 中 相应 的 位 保持 不 变 。 这 是 由 我 们 提 到 过 的 AND 运算 符 的 特性 决定 的 : 如 果 输 入 中 有 
一 个 是 0， 不 管 其 他 输入 是 什么 ， 输 出 都 是 0。 模式 中 的 复位 有 许多 应 用 ， 例 如 ， 如 果 一 个 
图 像 使 用 的 是 每 像素 只 有 一 位 (黑白 图 像 )， 那 么 我 们 能 使 用 掩 码 和 AND 运算 符 使 指定 像素 
变 黑 。 

例 4.7 使 用 掩 码 复位 模式 的 最 左 5 位 。 用 模式 10100110 测试 掩 码 。 

解 ” 掩 码 是 00000111， 应 用 掩 码 的 结果 是 : 


10 100 1 10 输入 
AND 00000 111 掩 码 
RE 1 1 0 输出 

注意 最 右边 的 3 位 保持 不 变 ， 而 最 左边 5 位 ， 不 管 它 们 先前 的 值 是 什么 ， 都 被 复位 ( 变 


为 0)。 
(3 ) 对 指定 的 位 置 位 
OR 运算 的 一 个 应 用 是 把 一 个 位 模式 的 指定 位 置 位 ( 置 1 )。 我 们 再 次 使 用 掩 码 ， 但 是 一 
个 不 同 的 掩 码 。 掩 码 中 的 1 位 对 第 一 个 输入 中 的 相应 的 位 进行 置 位 ， 而 掩 码 中 的 0 位 使 第 
一 个 输入 中 相应 的 位 保持 不 变 。 这 是 由 我 们 提 到 的 OR 运算 符 的 特性 决定 的 : 如 果 一 个 输入 
为 1， 不管 其 他 输入 是 什么 ， 输出 都 将 是 1。 模 式 中 的 位 置 位 有 许多 应 用 ， 例 如 ， 如 果 一 个 
图 像 使 用 的 是 每 像素 只 有 一 位 (黑白 图 像 )， 那 么 我 们 能 使 用 掩 码 和 OR 运算 符 使 指定 像素 
变 白 。 
例 4.8 ”使 用 掩 码 把 一 个 位 模式 的 最 左 5 位 置 位 。 使 用 10100110 测试 这 个 掩 码 。 
解 ” 此 掩 码 为 11111000。 应 用 此 掩 码 的 结果 为 : 
10 100 1 10 
OR 1 1 1 1 10000 掩 码 
1 0 


(4) 使 指定 的 位 反 转 

XOR 运算 的 一 个 应 用 是 使 指定 的 位 反 转 ， 我 们 再 次 使 用 掩 码 ， 但 是 一 个 不 同 的 掩 码 。 
掩 码 中 的 1 位 对 第 一 个 输入 中 的 相应 的 位 进行 反 转 ， 而 掩 码 中 的 0 位 使 第 一 个 输入 中 相应 的 
位 保持 不 变 。 这 是 由 我 们 提 到 的 XOR 运算 符 的 特性 决定 的 : 如 果 一 个 输入 为 1， 输出 与 相 
应 的 位 相反 。 注 意 NOT 运算 符 和 XOR 运算 符 间 的 区 别 。NOT 运算 符 是 将 输入 中 所 有 的 位 
求 反 ， 而 XOR 运算 符 只 是 对 第 一 个 输入 中 指定 的 位 求 反 ， 正 如 掩 码 中 所 定义 的 。 

例 4.9 用 掩 码 来 反 转 一 个 模式 的 最 左边 5 位 。 用 模式 10100110 检验 掩 码 。 

解 ” 掩 码 为 11111000。 运 用 掩 码 后 的 结果 为 : 


10 100 110 输入 
XOR 1 1 1 1 10 0 0 掩 码 


4.2 ” 移 位 运算 


移 位 运算 移动 模式 中 的 位 ， 改 变 位 的 位 置 。 它 们 能 向 左 或 向 右 移动 位 。 我 们 可 以 把 移 位 
运算 分 成 两 大 类 : 逻辑 移 位 运算 和 算术 移 位 运算 。 
逻辑 移 位 运算 

逻辑 移 位 运算 应 用 于 不 带 符号 位 的 数 的 模式 。 原 因 是 这 些 移 位 运算 可 能 会 改变 数 的 符 
号 ， 此 符号 是 由 模式 中 最 左 位 定义 的 。 我 们 区 分 两 类 逻辑 移 位 运算 ， 如 下 面 描述 。 

1. 逻辑 移 位 

逻辑 右 移 运算 把 每 一 位 向 右 移动 一 个 位 置 。 在 n 位 模式 中 ,最 右 位 丢失 ， 最 左 位 填 0。 
逻辑 左 移 运算 把 每 一 位 向 左 移动 一 个 位 置 。 在 位 模式 中 ， 最 左 位 丢失 ,最 右 位 填 0。 
SR A 


丢弃 丢弃 
a) 逻辑 右 移 b) 逻辑 左 移 


图 4-3 ”逻辑 移 位 运算 
例 4.10 对 位 模式 10011000 使 用 逻辑 左 移 运 算 。 
解 解 如 下 所 示 ， 最 左 位 被 丢弃 ，0 作为 最 右 位 被 插入 。 
二 100110 0 0 原始 的 
0011000 四 移 位 后 





循环 移 位 ， 

循环 移 位 运算 (旋转 运算 ) 对 位 进行 移 位 ， 但 没有 位 被 丢弃 或 增加 。 循 环 右 移 (或 右 旋转 ) 
把 每 一 位 向 右 移动 一 个 位 置 ， 最 右 位 被 回环 ， 成 为 最 左 位 。 循 环 左 移 (或 左旋 转 ) 把 每 一 位 向 
左 移动 一 个 位 置 ， 最 左 位 被 回环 ， 成 为 最 右 位 。 图 4-4 显示 了 循环 左 移 和 循环 右 移 运 算 。 








a) 循环 右 移 b) 循环 左 移 
图 4-4 循环 移 位 运算 


例 4.11 对 位 模式 10011000 使 用 循环 左 移 运 算 。 
解 ” 解 如 下 所 示 ， 最 左 位 被 回环 ， 成 为 最 右 位 。 
原始 的 二 1 0 0 1 10 0 0 回环 
移 位 后 00 1 10 00 
2. 算术 移 位 运算 
算术 移 位 运算 假定 位 模式 是 用 二 进 制 补 码 格式 表示 的 带 符号 位 的 整数 。 算 术 右 移 被 用 来 
对 整数 除 以 2; 而 算术 左 移 被 用 来 对 整数 乘 以 2( 后 面 讨 论 ) 。 这 些 运算 不 应 该 改变 符号 位 (最 
左 )。 算 术 右 移 保留 符号 位 ， 但 同时 也 把 它 复 制 ， 放 人 相 邻 的 右边 的 位 中 ， 因 此 符号 被 保存 。 
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算术 左 移 丢弃 符号 位 ， 接 受 它 的 左边 的 位 作为 符号 位 。 如 果 新 的 符号 位 与 原先 的 相同 ， 那 么 
运算 成 功 ， 否 则 发 生 上 溢 或 下 溢 ， 结 果 是 非法 的 。 图 4-5 显示 了 这 两 种 运算 。 
一 一 
He /ET 征 二、 
丢弃 0 
a) 算术 右 移 b) 算术 左 移 
图 4-5 算术 移 位 运算 


例 4.12 对 位 模式 10011001 使 用 算术 右 移 ， 模 式 是 二 进 制 补 码 格式 的 整数 。 
解 解 如 下 所 示 ， 最 左 位 被 保留 ， 被 复制 到 相 邻 的 右边 的 位 中 。 
算术 右 移 1 0 0 1 10 0 1 原始 的 
加 1001100 移 位 后 
原始 数 是 -103， 新 的 数 是 -52， 它 是 -103 被 除 以 2 并 取 整 的 结果 。 
例 4.13 对 位 模式 11011001 使 用 算术 左 移 ， 模式 是 二 进 制 补 码 格 式 的 整数 。 
解 ” 解 如 下 所 示 ， 最 左 位 被 丢弃 ，0 作为 最 右 位 被 插入 。 
算术 左 移 1 1 0 1 1 0 0 1 原始 的 
1011001 加 移 位 后 
原始 数 是 -39， 新 的 数 是 -78 ， 原 始 数 被 乘 以 2。 因 为 没有 下 溢 的 发 生 ， 所 以 运算 合法 。 
例 4.14 对 位 模式 01111111 使 用 算术 左 移 ， 模 式 是 二 进 制 补 码 格式 的 整数 。 
解 解 如 下 所 示 ， 最 左 位 被 丢弃 ，0 作为 最 右 位 被 插入 。 
算术 左 移 0 1 1 1 1 1 1 1 原始 的 
11111 1 1 国 ” 移 位 后 
原始 数 是 127， 新 的 数 是 -2。 因 为 上 溢 发 生 ， 所 以 结果 非法 。 期 望 的 答案 是 127 x 2 = 
254， 这 个 数 不 能 用 8 位 模式 表示 。 
例 4.15 逻辑 运算 和 逻辑 移 位 运算 给 我 们 提供 了 操纵 位 模式 的 工具 。 假 设 有 一 个 模式 ， 
在 判断 过 程 中 需要 使 用 此 模式 的 第 三 位 (从 右 起 )， 需 要 知道 这 特殊 的 位 是 0 或 1。 下 面 显 示 
了 如 何 找 出 这 位 。 





hgfed 四 下。 a 原始 的 
0hgfed 加 ， 一 次 右 移 
00hgfed 加 二 次 右 移 
AND 00000001 掩 码 


我 们 先 对 模式 进行 两 次 右 移 ， 这 样 目 标 位 被 移 到 最 右 的 位 置 。 然 后 通过 最 右 位 为 1 其 余 
为 0 的 掩 码 和 AND 运算 就 能 得 出 结果 。 结 果 是 有 7 个 0， 目 标 位 在 最 右 位 置 的 模式 。 然 后 
可 以 测试 结果 : 如 果 它 是 无 符号 的 整数 1， 那 么 目标 位 就 是 1 ; 而 如 果 结 果 是 无 符号 的 整数 
0， 那 么 目标 位 就 是 0。 


4.3 算术 运算 
算术 运算 包括 加 、 减 、 乘 、 除 ， 适 用 于 整数 和 浮 点 数 。 
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4.3.1 整数 的 算术 运算 


所 有 算术 运算 〈 如 加 、 减 、 乘 、 除 ) 均 适 用 于 整数 。 虽 然 整数 的 乘法 〈 除 法 ) 能 使 用 重 
复 的 加 法 (减法) 来 实现 ， 但 程序 是 低 效 的 。 对 于 乘法 和 除法 有 更 高 效 的 程序 (如 Booth 程 
序 ), 但 这 些 超过 了 本 书 的 范围 ， 基 于 这 个 原因 ， 我 们 这 里 只 讨论 整数 的 加 法 和 减法 。 

1. 二 进 制 补 码 中 的 加 减法 

我 们 首先 讨论 二 进 制 补 码 表示 的 整数 的 加 法 和 减法 ， 这 是 因为 它 较 容易 。 正 如 我 们 在 第 
3 章 讨论 的 ， 整 数 通常 是 以 二 进 制 补 码 形式 存储 的 。 二 进 制 补 码 表示 法 的 一 个 优点 是 加 法 和 
减法 间 没 有 区 别 。 当 遇 到 减法 时 ， 计 算 机 只 简单 地 把 它 转 变 为 加 法 ， 但 要 为 第 二 个 数 求 二 进 
制 的 补 。 换 言 之 : 

4+B *> 4+ (B+1)， 这 里 的 (B+1 ) 表示 B 的 补 码 

这 就 意味 着 我 们 只 需要 讨论 加 法 。 二 进 制 补 码 中 的 加 法 就 像 十 进 制 中 的 加 法 一 样 : 列 与 
列 相 加 ， 如 果 有 进位 ， 就 加 到 下 一 列 上 。 但 是 ， 最 后 一 列 的 进位 被 舍弃 。 

记 住 ， 我们 是 一 列 接 一 列 相 加 整数 的 。 在 每 一 列 中 ， 如 果 没 有 从 前 一 列 来 的 进位 ， 那 就 
有 两 位 相 加 ; 或 者 如 果 有 从 前 一 列 来 的 进位 ， 那 就 有 三 位 相 加 。 在 每 一 列 中 ，1 的 数目 可 以 
是 0、1、2 或 3。 表 4-1 显示 了 和 以 及 进位 (C)。 


表 4-1 两 位 相 加 的 进位 以 及 和 结果 





现在 我 们 能 显示 两 个 用 二 进 制 补 码 格式 表示 的 整数 的 加 法 或 减法 过 程 〈 图 4-6 )。 注 意 我 
们 使 用 〈 筷 十 1) 表示 XX 的 补 码 ， 因 为 际 表 示 的 邓 反 码 ， 所 以 这 种 记号 非常 常见 。 如 果 给 一 
个 整数 的 反 码 加 1， 就 得 到 它 的 补 码 。 








图 4-6 二进制 补 码 格式 表示 的 整数 的 加 法 和 减法 


过 程 如 下 : 

1 ) 如 果 运 算是 减法 ， 我 们 取 第 二 个 整数 的 二 进 制 补 码 ， 和 否则 ， 转 下 一 步 。 

2 ) 两 个 整数 相 加 。 

例 4.16 以 二 进 制 补 码 格式 存储 两 个 整数 4 和 B， 显 示 B 是 如 何 被 加 到 4 上 的 。 
A=(00010001)。 B=(00010110), 


56 名 4 全 


解 ”运算 是 相 加 ，4 被 加 到 8B 上 ， 结 果 存储 在 RR 中 。 


0 
用 十 进 制 检查 结果 : (+17)+(+22)=(+39)。 
例 4.17 以 二 进 制 补 码 格 式 存储 两 个 整数 4 和 B， 显 示 B 是 如 何 被 加 到 4 上 的 。 
A=(00011000)。 B=(11101111); 
解 ”运算 是 相 加 ，4 被 加 到 8B 上， 结果 存储 在 R 中 。 注 意 ， 最 后 的 进位 被 舍弃 ， 因 为 存 
储 器 大 小 只 有 8 位。 
进位 


用 十 进 制 检查 结果 : (+24) + (-17)=(+7)。 | 

例 4.18 ”以 二 进 制 补 码 格 式 存 储 两 个 整数 4 和 B， 显 示 如 何 从 4 中 减 去 B。 
A=(00011000)。 B=(11101111); 

解 ” 运 算是 相 减 ，4 被 加 到 (B+1 ) 上 ,结果 存储 在 RR 中。 


用 十 进 制 检查 结果 : (+24) - (-17)=(+41)。 
例 4.19 以 二 进 制 补 码 格式 存储 两 个 整数 4 和 下， 显示 如 何 从 4 中 减 去 B。 
4=(11011101) B=(00010100); 
解 ” 运 算是 相 减 ，4 被 加 到 (B+1 ) 上 ， 结 果 存 储 在 尺 中 。 
1111 1-i 进位 
11011101 4 
图 1110 110 0 (CD 
1 100 100 1 R 
用 十 进 制 检查 结果 : (-35) - (+20)=(-55)。 注 意 最 后 的 进位 被 舍弃 。 
例 4.20 以 二 进 制 补 码 格 式 存 储 两 个 整数 4 和 B， 显 示 B 如 何 被 加 到 4 上 。 
A=(01111111), B=(00000011); 
解 ” 运 算是 相 加 ，4 被 加 到 8B 上， 结果 存储 在 R 中 。 
1 1 1 1 1 1 1 进位 
1 1 1 1 1 1 1 4 
国 0000001158 
00000 10R 
我 们 期 望 的 结果 是 127+3=130， 但 答案 是 -126。 错 误 是 由 于 上 溢 ， 因 为 期 望 的 答案 
(+130 ) 不 在 范围 -128 一 +127 之 间 。 


一 
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中 数字 上 的 算术 运算 时 ， 要 记 住 每 个 数字 和 结果 应 


2. .符号 加 绝对 值 浆 数 的 加 减法 

用 符号 加 绝对 值 表示 的 整数 的 加 法 和 减法 看 起 来 非常 复杂 。 我 们 有 4 种 不 同 的 符号 组 合 
(两 个 符号 ， 每 个 有 两 个 值 )， 对 于 减法 有 4 种 不 同 的 条 件 。 这 就 意味 着 我 们 要 考虑 8 种 不 同 
的 情况 。 但 是 ， 如 果 先 检查 符号 ， 则 可 以 简化 这 些 情况 ， 如 图 4-7 所 示 。 








R, <— B, 停止 
停止 @ 
图 4-7 符号 加 绝对 值 格式 的 整数 的 加 法 和 减法 


首先 来 解释 流程 图 : 

1 ) 检查 运算 ， 如果 运算 是 减法 ， 那 么 改变 第 二 个 整数 (8) 的 符号 。 这 就 意味 着 我 们 现 
在 只 要 考虑 两 符号 整数 的 加 法 。 

2 ) 对 两 符号 应 用 XOR 运算 ， 如果 结果 (存储 在 临时 单元 S$ 中 ) 是 0， 则 意味 着 符号 是 
相同 的 (或 者 两 符号 都 是 正 的 ,或 者 两 符号 都 是 负 的 )。 

3 ) 如 果 符 号 是 相同 的 ，R= + (w+ Bw)， 我 们 需要 相 加 绝对 值 ， 结 果 的 符号 是 相同 的 符 
号 ， 所 以 得 到 : 

Ru=(A4m)+(Bv) 和 Rs=4s 

这 里 下 标 M 意味 着 绝对 值 ， 下 标 S 意味 着 符号 。 但 是 ， 在 这 种 情况 下 ， 我 们 应 该 仔细 
考虑 上 溢 。 我 们 相 加 两 个 绝对 值 时 ， 可 能 会 发 生 上 溢 ， 它 必须 被 报告 ， 处 理 过 程 终止 。 

4) 如 果 符 号 不 同 ，R= + (dvwv-Bw， 则 需要 从 hw 中 减 去 Bu， 然后 对 符号 进行 判断 ， 不 
是 一 位 接 一 位 地 相 减 ， 而 是 取 第 二 个 绝对 值 (By) 的 二 进 制 补 码 ， 相 加 它们 。 结 果 的 符号 是 
较 大 绝对 值 整数 的 符号 。 
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a. 可 以 证 明 ， 如 果 4w > Bu， 那 就 有 上 溢 ， 结 果 是 一 个 正 数 。 因 此 ， 如 果 有 上 溢 ， 则 售 
弃 上 溢 ， 使 结果 的 符号 取 4 的 符号 。 

b. 可 以 证 明 ， 如 果 4m < Bw， 那 就 没有 上 洲 ， 结 果 是 一 个 负数 。 因 此 ， 如 果 没 有 上 洲 ， 
则 取 结 果 的 二 进 制 补 码 ， 使 结果 的 符号 取 B 的 符号 。 

例 4.21 以 符号 加 绝对 值 格式 存储 两 整数 4 和 B (为 了 清楚 起 见 ， 我 们 把 符号 与 绝对 值 
分 隔 开 )， 显 示 妃 是 如 何 被 加 到 4 上 的 。 

A=(0 0010001)。 B=(0 0010110); 

解 ” 运 算是 相 加 ，B 的 符号 没有 改变 ， 既 然 S = 4s XOR Bs=0, Ruy= Am+ Bm 和 Rs=4s， 

那么 这 里 没有 上 洲 。 


符号 没有 上 洲 1 进位 
As 0010001 A 
Bs +0010110 Bu 
Rs 0100111 Rn 


用 十 进 制 检验 结果 : (+17) + (+22) = (+39)。 
例 4.22 以 符号 加 绝对 值 格式 存储 两 整数 4 和 8B， 显示 B 是 如 何 被 加 到 4 上 的 。 
A=(0 0010001)。 B=(1 0010110); 
解 ” 运 算是 相 加 , B 的 符号 没有 改变 , S=4s XOR Bs=1, Rw=Am+ (B+1)， 既 然 没 有 上 洲 ， 
我 们 需要 取 Rw 的 二 进 制 补 码 ，R 的 符号 是 B 的 符号 。 


符号 没有 上 洲 进位 

4 本 0:010001 Av 

Bs a + 1 10 10 10 (But!1) 
1 1110 1 1 Ru 

Rs 加 0000101 Rn=CRvn+l) 


用 十 进 制 检验 结果 : (+17) + (-22)=(-5)。 
例 4.23 ”以 符号 加 绝对 值 格式 存储 两 整数 4 和 8， 显示 如 何 从 4 中 减 去 B。 
A=(1 1010001) B=(1 0010110); 
解 ” 运 算是 相 减 ，Bs=Bs，S=As XOR Bs=1，Ru=4w+(Bwu+1)， 既 然 有 上 溢 ，Rw 的 值 就 
是 最 终 的 值 ，R 的 符号 是 4 的 符号 。 


符号 有 上 溢 进位 
4s 1 1 10 1000 1 A 
Bs 1 + 1 10 10 1 0 (+ 
Rs 1 0 1 1 10 1 1 Ru 


用 十 进 制 检验 结果 : (-81) - (-22)=(-59)。 
4.3.2 ”实数 的 算术 运算 


像 加 、 减 、 乘 和 除 这 样 的 算术 运算 都 能 应 用 于 用 浮 点 数 格式 存储 的 实数 上 。 两 实数 的 乘 
法 涉及 两 个 用 符号 加 绝对 值 表 示 的 整数 的 乘法 ; 两 实数 的 除法 涉及 两 个 用 符号 加 绝对 值 表 示 
的 整数 的 除法 。 既 然 我 们 不 讨论 用 符号 加 绝对 值 表示 的 整数 的 乘法 或 除法 ， 那 我 们 也 不 讨论 
实数 的 乘法 和 除法 ， 只 讨论 实数 的 加 法 和 减法 。 
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实数 的 加 减法 
以 浮 点 数 存储 的 实数 的 加 法 和 减法 被 简化 为 小 数 点 对 齐 后 以 符号 加 绝对 值 格式 (符号 和 
尾数 的 组 合 ) 存储 的 两 整数 的 加 法 和 减法 。 图 4-8 显示 了 处 理 过 程 的 简化 版 本 (有些 特殊 的 


情况 被 我 们 忽略 了 )。 





图 4-8 浮 点 数 格式 实数 的 加 法 和 减法 


简化 的 过 程 如 下 : 

1 ) 如 果 两 数 (4 或 8) 中 任 一 个 为 0， 那 令 结果 为 0， 过程 终止 。 

2 ) 如 果 运 算是 减法 ， 那 么 改变 第 二 个 数 (8 ) 的 符号 来 模拟 加 法 。 

3 ) 通过 在 尾数 中 包含 隐 含 的 1 和 增加 指数 ， 两 个 数 去 规范 化 。 此 时 的 尾数 部 分 看 做 一 
个 整数 。 

4) 然后 统一 指数 ， 这 意味 着 我 们 增加 较 小 的 指数 ， 移 位 相应 的 尾数 ， 直 到 两 个 数 具 有 
相同 的 指数 。 例 如 ， 如 果 有 : 

1.11101X24+ 1.01 X22 


那么 需要 把 两 个 指数 变 成 4: 
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1.11101X24+ 0.0101 X24 

5 ) 现在 ， 把 每 个 数 的 符号 和 尾数 的 组 合 看 成 一 个 符号 加 绝对 值 格式 的 整数 。 像 本 章 前 
面 介绍 的 一 样 ， 相 加 这 两 个 整数 。 

6 ) 最 后 ， 再 次 规范 化 数 ， 变 成 1.000111 X25。 

例 4.24 显示 计算 机 是 如 何 计算 结果 的 : (+5.75) + (+161.875)=(+167.625)。 

解 ” 正 如 我 们 在 第 3 章 看 到 的 ， 这 两 个 数 以 浮 点 数 格式 存储 ， 如 下 所 示 。 但 是 我 们 需要 
记 住 每 个 数字 有 隐 含 的 1 ( 它 只 是 假设 的 ， 没 有 被 存储 )。 注 意 ， 在 这 里 $ 代表 符号 , E 代表 
指数 ，M 代表 尾数 。 

S E M 
A 0 10000001 01110000000000000000000 
B 0 10000110 € 01000011110000000000000 

UML 图 (图 4-8 ) 中 的 前 几 步 是 不 需要 的 ， 我 们 进入 去 规范 化 ， 给 尾数 增加 隐 含 的 1， 
增加 指数 进行 去 规范 化 。 现 在 两 个 去 规范 化 的 尾数 都 是 24 位， 包含 了 隐 含 的 1。 它们 应 该 
被 存储 在 有 24 位 的 存储 单元 中 。 每 个 指数 都 被 增加 了 。 

S E 去 规范 化 的 M 
4 0 10000010 101110000000000000000000 
B 0 10000111 “101000011110000000000000 
现在 我 们 对 齐 尾数 ， 需 要 增加 第 一 个 指数 ， 右 移 它 的 尾数 。 我 们 把 第 一 个 指数 改 为 
(10000111),:， 所 以 需要 把 第 一 个 尾数 右 移 5 位 。 
S E 去 规范 化 的 M 
A 0 10000111 000001011100000000000000 
B 0 10000111 ” 101000011110000000000000 
现在 进行 符号 加 绝对 值 加 法 ， 把 每 个 数 的 符号 和 尾数 看 成 是 符号 加 绝对 值 表 示 的 整数 。 
S E 去 规范 化 的 M 
R 0 10000111 101001111010000000000000 
在 尾数 中 没有 溢出 ， 所 以 我 们 规范 化 。 
S E M 
R 0 10000110 01001111010000000000000 

尾数 只 要 23 位 ,不 需要 四 舍 五 人 。E=(10000110),=134，M=0100111101。 换 言 之 , 结 
果 是 (1.0100111101)z x 234-27=(10100111.101):=167.625。 

例 4.25 显示 计算 机 是 如 何 计算 结果 的 : (+5.75) + (-7.023 437 5)=-1.273 437 5。 

解 这 两 个 数 以 浮 点 数 格式 存储 ， 如 下 所 示 。 

S 和 M 
4 0 10000001 “01110000000000000000000 
B 1 10000001 ”11000001100000000000000 
去 规范 化 的 结果 为 : 
S E 去 规范 化 的 M 
4 0 10000010 “101110000000000000000000 
B 1 10000010 111000001100000000000000 
对 齐 是 不 需要 的 (两 指数 是 相同 的 )， 所 以 我 们 在 符号 和 尾数 的 组 合 上 应 用 加 法 运算 ， 
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结果 显示 如 下 ， 其 中 结果 的 符号 是 负 的 : 


S E 去 规范 化 的 M 
R 1 10000010 ” 001010001100000000000000 


现在 我 们 需要 规范 化 ， 降 低 指数 三 次 ， 左 移 去 规范 化 尾数 三 位 : 


S E M 
R 1 01111111 010001100000000000000000 


尾数 现在 是 24 位 ， 所 以 四 舍 五 人 到 23 位 。 


S E M 
R 1 01111111 °C 01000110000000000000000 


结果 是 R=-227-27X1.0100011=-1.273 437 5， 正 是 所 期 望 的 。 
4.4 ” 章 末 材料 
推荐 读物 

有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 


小 结 


Mano, M. Computer System Architecture, Upper Saddle River, NJ: Prentice Hall, 1993 
Null, L. and Lobur, J. Computer Organization and Architecture, Sudbury, MA: Jones 
and Bartlett, 2003 

Stalling, W. Computer Organization and Architecture, Upper Saddle River, NJ: Prentice 
Hall, 2000 


数据 上 的 运算 分 成 三 大 类 : 逻辑 运算 、 移 位 运算 和 算术 运算 。 人 逻辑 运算 是 指 那 些 应 
用 于 位 模式 单独 位 或 两 模式 中 相应 的 两 位 上 的 相同 基本 运算 。 移 位 运算 移 到 模式 中 


的 位 。 算 术 运 算 涉及 加 、 减 、 乘 和 除 。 


本 章 讨论 了 4 种 逻辑 运算 (NOT、AND、OR 和 XOR),， 它们 能 用 在 位 层次 或 模式 层 
次 上 。NOT 运算 符 是 一 元 运算 符 , 而 AND、OR 和 XOR 是 二 元 运算 符 。 

NOT 运算 符 的 唯一 应 用 就 是 对 整个 模式 求 反 ; AND 运算 符 的 一 个 应 用 就 是 对 位 模式 
中 指定 的 位 进行 复位 ( 置 为 0); OR 运算 符 的 一 个 应 用 就 是 对 位 模式 中 指定 的 位 进行 
置 位 ( 置 为 1 ); XOR 运算 符 的 一 个 应 用 就 是 对 位 模式 中 指定 的 位 进行 反 转 ( 求 反 )。 
移 位 运算 移 到 模式 中 的 位 : 它们 改变 位 的 位 置 。 我 们 能 把 移 位 运算 分 成 两 类 : 逻辑 
移 位 和 算术 移 位 。 逻 辑 移 位 被 应 用 于 不 表示 为 符号 数 的 模式 ; 算术 移 位 假定 位 模式 
是 二 进 制 补 码 格式 的 符号 整数 。 

像 加 、 减 、 乘 和 除 这 样 的 所 有 的 算术 运算 都 能 应 用 于 整数 。 整 数 通常 是 存储 在 二 进 
制 补 码 格式 中 的 。 二 进 制 补 码 格式 表示 的 一 个 优点 就 是 加 法 和 减法 间 没 有 不 同 。 当 
遇 到 减法 时 ， 计 算 机 简单 地 把 它 改变 为 加 法 运算 ， 然 而 此 时 对 第 二 个 数 而 言 是 求 反 
运算 。 用 符号 加 绝对 值 表示 的 整数 的 加 法 和 减法 看 起 来 非常 复杂 ， 我 们 需要 考虑 8 
种 情况 。 

像 加 、 减 、 乘 和 除 这 样 的 所 有 的 算术 运算 都 能 应 用 于 用 浮 点 数 表示 的 实数 ， 用 浮 点 
数 表示 的 实数 的 加 法 和 减法 归纳 为 小 数 点 对 齐 后 的 存储 在 符号 加 绝对 值 中 的 两 整数 
的 加 法 和 减法 。 
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4.5 练习 
小 测验 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建 议 学 生 在 继续 本 章 习题 前 首先 
完成 相关 测验 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 算术 运算 和 逻辑 运算 有 什么 区 别 ? 

2. 在 二 进 制 补 码 格式 的 整数 相 加 中 ， 最 左边 一 列 是 怎样 进位 的 ? 
3.n 的 位 分 配 单元 可 以 等 于 1 吗 ? 为 什么 ? 

4. 解释 “溢出 ”这 个 词 。 

5. 在 浮 点 数 的 加 法 运算 中 ， 怎 样 调整 指数 不 同 的 数 的 表示 方法 ? 
6. 一 元 运算 和 二 元 运算 有 何不 同 ? 

7. 二 元 逻辑 运算 有 哪些 ? 

8. 什么 是 真 值 表 ? 

9. NOT 运算 符 的 作用 是 什么 ? 

10. AND 运算 符 的 结果 何 时 为 真 ? 

11. OR 运算 符 的 结果 何 时 为 真 ? 

12. XOR 运算 符 的 结果 何 时 为 真 ? 

13. 说 出 AND 运算 符 本 章 讨论 的 一 个 重要 特性 。 

14. 说 出 OR 运算 符 本 章 讨论 的 一 个 重要 特性 。 

15. 说 出 XOR 运算 符 本 章 讨论 的 一 个 重要 特性 。 

16. 何 种 二 元 运算 可 以 用 来 置 位 ? 掩 码 应 该 用 什么 位 模式 ? 

17. 何 种 二 元 运算 可 以 用 来 复位 ? 掩 码 应 该 用 什么 位 模式 ? 
18. 何 种 二 元 运算 可 以 用 来 反 转 ? 掩 码 应 该 用 什么 位 模式 ? 

19. 逻辑 和 算术 移 位 间 的 区 别 是 什么 ? 


练习 题 
1. 求 下 列 运算 的 结果 : 

a. NOT (99)i6 b. NOT (FF)i6 c. NOT (00)ie d. NOT (01)i6 
2. 求 下 列 运算 的 结果 : 

a. (99)i6 AND (99)ie b. (99)ig6 AND (00)ie c. (99)i6 AND (FF)ie d. (FF)ie AND (FF)ie 
3. 求 下 列 运算 的 结果 : 

a. (99)16 OR (99)i6 b. (99)i6 OR (00)i6 c. (99)16 OR (FF)i6 d. (FF)ie OR (FF)i6 
4. 求 下 列 运算 的 结果 : 

a. NOT[(99)is OR (99)i6] b. (99)ie OR [NOT (00)i] 

c. [(99)ie6AND (33)ie] OR [(00)is AND (FF)i] d. (99)1s OR (33)is AND {(00)is OR (FF)'s] 


5. 要 将 一 个 位 模式 的 最 左 4 位 复位 ( 置 0 )， 求 掩 码 和 运算 。 

6. 要 将 一 个 位 模式 的 最 右 4 位 置 位 ( 置 1 )， 求 掩 码 和 运算 。 
7. 要 将 一 个 位 模式 的 最 右 3 位 和 最 左 2 位 反 转 ， 求 掩 码 和 运算 。 
8. 要 将 一 个 位 模式 的 最 左 3 位 和 最 右 2 位 复位 ， 求 掩 码 和 运算 。 
9. 用 移 位 运算 将 一 个 无 符号 数 除 以 4。 

10. 用 移 位 运算 将 一 个 无 符号 数 乘 以 8。 
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11. 综合 使 用 逻辑 和 移 位 运算 求 取 一 个 无 符号 数 的 第 4 和 5 位 。 
12. 用 8 位 分 配 单元 ， 先 把 下 列 数 转换 成 二 进 制 补 码 ， 然 后 运算 ,再 把 结果 转 成 十 进 制 。 


a. 19+23 b. 19-23 c. -19+23 d. -19-23 
13. 用 16 位 分 配 单元 ， 先 把 下 列 数 转 换 成 二 进 制 补 码 ， 然 后 运算 ,再 把 结果 转 成 十 进 制 。 
a. 161+1023 b. 161-1023 c. -161+1023 d. -161-1023 


14. 如 果 数 字 和 结果 都 用 8 位 二 进 制 补 码 表示 ， 下 列 哪个 运算 会 溢出 ? 
a. 11000010+00111111 b. 00000010+00111111 c. 11000010+11111111 d. 00000010+11111111 
15. 如 果 数 字 和 结果 都 用 8 位 二 进 制 补 码 表示 ， 不 通过 实际 的 计算 ,我 们 能 说 出 下 列 哪个 运算 会 洲 
出 吗 ? 


a. 32+105 b. 32-105 c. -32+105 d. -32-105 
16. 假设 数字 皆 以 16 位 二 进 制 补 码 表 示 法 来 存储 ， 求 结果 。 假 设 以 十 六 进 制 表示 法 ， 结 果 又 如 何 ? 

a. (012A)ie+ (OE27)i。 b. (712A)is+ (9E00)is c. (8011)ie+ (0001)ie d. (E12A)is+ (9E27)i6 
17. 使 用 一 个 8 位 的 分 配音 元， 首先 把 下 列 每 个 数字 转化 为 符号 加 绝对 值 表示 法 ， 进 行 运算 ,然后 把 结 

果 转 化 为 十 进 制 。 . 

a. 19+23 b. 19-23 c. -19+23 d. -19-23 
18. 计算 下 列 使 用 IEEE_127 (参见 第 3 章 ) 的 浮 点 数 运 算 结 果 。 

a. 34.75+23.125 b. -12.625+451.00 c. 33.1875-0.4375 d. -344.3125-123.5625 
19. 下 列 哪 种 情况 永 不 会 发 生 溢出 ? 证 明 你 的 观点 。 

a. 两 个 正 整数 相 加  b. 正 整 数 加 负 整 数 c. 负 整 数 减 正 整数 d. 两 个 负 整 数 相 减 


20. 把 一 个 整数 加 到 它 的 反 码 上 的 结果 是 什么 ? 
21. 把 一 个 整数 加 到 它 的 补 码 上 的 结果 是 什么 ? 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨 论 材 料 的 理解 。 
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计算 机 组 成 





本 章 我 们 将 讨论 计算 机 的 组 成 。 讲 解 每 台 计 算 机 是 如 何 由 三 个 子 系统 组 成 的 。 我 们 还 介 
绍 了 简单 假想 的 计算 机 ， 它 能 运行 简单 程序 ， 完 成 基本 的 算术 或 逻辑 运算 。 
目标 
通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 
e 列 出 计算 机 的 三 个 子 系统 ; 
e 描述 计算 机 中 央 处 理 单元 (CPU) 的 作用 ; 
描述 典型 计算 机 中 指令 周期 的 取 指 令 一 译 码 一 执行 阶段 ; 
述 主 存 和 它 的 地 址 空间 ; 
区 分 主 存 和 缓存 ; 
定义 输入 /输出 子 系统 ; 
理解 子 系统 间 的 互相 连接 ， 列 出 不 同 总 线 系 统 ; 
描述 输入 /输出 编 址 的 不 同方 法 ; 
区 分 设计 计算 机 体系 结构 的 两 种 主要 趋势 ; 
理解 计算 机 是 如 何 使 用 管道 改善 吞吐 量 的 ; 
理解 并 行 处 理 是 如 何 改善 计算 机 的 吞吐 量 的 。 


5.1 引言 


计算 机 的 组 成 部 件 可 以 分 为 三 大 类 (或 子 系统 ): 中 央 蕊 于 于 全 
处 理 单元 (CPU)、 主 存储 器 和 输入 / 输出 子 系统 。 接 下 来 人 
的 三 个 部 分 将 讨论 这 些 子 系统 以 及 如 何 将 这 些 子 系统 组 成 
一 台 计 算 机 。 图 5-1 给 出 了 组 成 计算 机 的 这 三 个 子 系统 。 


存储 器 















= 
输入 /输出 子 系统 
5.2 中央 处 理 单元 图 5-1 计算 机 硬件 ( 子 系统 ) 


中 央 处 理 单元 (CPU) 用 于 数据 的 运算 。 在 大 多 数 体系 结构 中 ， 它 有 三 个 组 成 部 分 : 算 


术 逻 辑 单元 ( ALU)、 控 制 单元 、 寄 存 器 组 、 快 速 存储 定位 
(图 5-2 )。 


5.2.1 算术 逻辑 单元 
A 


算术 逻辑 单元 (ALU) 对 数据 进行 逻辑 、 移 位 和 算术 
运算 。 





1. 逻辑 运算 控制 单元 
在 第 4 章 中 ,我 们 讨论 了 几 种 逻辑 运算 ， 如: 非 、 与 、 
或 和 异 或 。 这 些 运 算 把 输入 数据 作为 二 进 制 位 模式 ， 运 算 中 央 处 理 单元 (CPU ) 


的 结果 也 是 二 进 制 位 模式 。 图 5-2 中央 处 理 单元 (CPU ) 
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2. 移 位 运算 

在 第 4 章 中 ,我 们 讨论 了 数据 的 两 种 移 位 运算 : 届 辑 移 位 运算 和 算术 移 位 运算 。 逻 辑 移 
位 运算 用 来 对 二 进 制 位 模式 进行 向 左 或 右 的 移 位 ， 而 算术 运算 被 应 用 于 整数 。 它 们 的 主要 用 
途 是 用 2 除 或 乘 一 个 整数 。 

3. 算术 运算 

在 第 4 章 我 们 讨论 了 整数 和 实数 上 的 一 些 算术 运算 ， 我 们 提 到 有 些 运算 能 被 更 高 效率 的 
硬件 实现 。 


5.2.2 寄存 器 


寄存 器 是 用 来 存放 临时 数据 的 高 速 独立 的 存储 单元 。CPU 的 运算 离 不 开 大 量 寄存 器 的 
使 用 。 其 中 的 一 些 寄 存 器 可 参见 图 5-2。 . 

1. 数据 寄存 器 ， 

在 过 去 ， 计 算 机 只 有 几 个 数据 寄存 器 用 来 存储 输入 数据 和 运算 结果 。 现 在 ， 由 于 越 来 越 
多 的 复杂 运算 改 由 硬件 设备 实现 (而 不 是 使 用 软件 )， 所 以 计算 机 在 CPU 中 使 用 几 十 个 寄存 
器 来 提高 运算 速度 ， 并 且 需 要 一 些 寄存 器 来 保存 这 些 运算 的 中 间 结 果 。 在 图 5-2 中 ， 数 据 寄 
存 器 被 命名 为 Ri 到 R;。 

2. 指令 寄存 器 

现在 ， 计 算 机 存储 的 不 仅 是 数据 ， 还 有 存储 在 内 存 中 相对 应 的 程序 。CPU 的 主要 职责 
是 : 从 内 存 中 逐条 地 取出 指令 ， 并 将 取出 的 指令 存储 在 指令 寄存 器 (图 5-2 中 寄存 器 IR) 中 ， 
解释 并 执行 指令 。 我 们 将 在 接 下 来 的 小 节 中 讨 1 耸 这 个 问题 。 

3. 程序 计数 器 

CPU 中 另 一 个 通用 寄存 器 是 程序 计数 器 (图 5-2 中 的 PC 寄存 器 )。 程 序 计数 器 中 保存 着 
当前 正在 执行 的 指令 。 当 前 的 指令 执行 完 后 ， 计 数 器 将 自动 加 1， 指 向 下 一 条 指令 的 内 存 地 址 。 


5.2.3 ”控制 单元 


CPU 的 第 三 个 部 分 是 控制 单元 ， 控 制 单元 控制 各 个 子 系统 的 操作 。 控 制 是 通过 从 控制 
单元 到 其 他 子 系统 的 信号 来 进行 。 


5.3” 主 存储 器 


主 存储 器 是 计算 机 内 的 第 二 个 子 系统 (图 5-3 )。 它 是 存储 单元 的 集合 ， 每 一 个 存储 单元 
都 有 唯一 的 标识 ， 称 为 地 址 。 数 据 以 称 为 字 的 位 组 的 形式 在 内 存 中 传人 和 传 出 。 字 可 以 是 8 
位 、16 位 、32 位 ， 甚 至 有 时 是 64 位 〈 还 在 增长 )， 如 果 字 是 8 位 ， 一 般 称 为 1 字 节 。 术 语 
字 节 在 计算 机 科学 中 使 用 相当 普遍 ， 因 此 有 时 称 16 位 为 2 字 节 ，32 位 为 4 字 节 。 

地 址 一 = 0000000000 | 
0000000001 
0000000010 











1111111111 


存储 器 
图 5-3 ” 主 存 储 器 
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5.3.1 ”地址 空间 


在 存储 器 中 存 取 每 个 字 都 需要 有 相应 的 标识 符 。 尽 管 程序 员 使 用 命名 的 方式 来 区 分 字 
(或 一 组 字 的 集合 )， 但 在 硬件 层次 上 ， 每 个 字 都 是 通过 地 址 来 标识 的 。 所 有 在 存储 器 中 标识 
的 独立 的 地 址 单元 的 总 数 称 为 地 址 空间 。 例 如 ， 一 个 64 KB 、 字 长 为 1 字 节 的 内 存 的 地 址 空 
间 的 范围 为 0 一 65 535。 

表 5-1 给 出 了 经 常用 来 表示 存储 大 小 的 单位 名 称 。 注 意 这 些 专用 术语 可 能 有 误导 ， 好 像 
以 10 的 圭 的 形式 来 近似 表示 字 节 数 ， 而 实际 上 字 节 的 数目 是 2 的 寡 。 采 用 2 的 寡 形 式 为 单 
位 使 得 寻 址 更 为 方便 。 


表 5-1 存储 单位 


2! (1024 ) 字 节 
22 (1 048 576 ) 字 节 


230 (1 073 741 824 ) 字 节 





作为 位 模式 的 地 址 

由 于 计算 机 都 是 以 位 模式 存储 数 并 进行 运算 ， 因 此 地 址 本 身 也 是 用 位 模式 表示 的 。 如 
果 一 个 内 存 是 64 K (2 )， 字 长 为 1 字 节 ， 和 那么 就 需要 16 位 的 位 模式 来 确定 地 址 。 回 顾 
第 3 章 我 们 曾经 提 到 地 址 用 无 符号 整数 表示 (不 用 负 的 地 址 )。 换 言 之 ， 起 始 地 址 通常 是 
0000000000000000 (地 址 0 )， 最 后 一 个 地 址 通常 是 111111111111111t1 (地 址 65 535 )。 通 常 ， 
如 果 一 个 计算 机 及 个 字 的 存储 空间 ， 那 就 需要 有 log2N 位 的 无 符号 整数 来 确定 一 个 存储 
单元 。 

内 存 地 址 用 无 符号 二 进 制 整数 定义 。 

例 5.1 一 台 计 算 机 有 32 MB ( 兆 字 节 ) 内 存 。 需 要 多 少 位 来 寻 址 内 存 中 的 任意 一 个 
字 节 ? 

解 ”内存 地 址 空间 是 32 MB， 即 25 (25X22 )。 这 就 意味 着 需要 log225 (25 位 ) 来 标 
识 每 一 个 字 节 。 

例 5.2 一 台 计 算 机 有 128 MB 内 存 。 计 算 机 字 长 为 8 字 节 ， 需 要 多 少 位 来 寻 址 内 存 中 
任意 一 个 单字 ? 

解 ”内 存 地 址 空间 是 128 MB ， 即 2”。 但 是 ， 每 个 字 是 8 ( 2; ) 字 节 ， 这 意味 着 需要 22? 
个 字 ， 也 就 是 说 你 要 log22”*”( 24 位 ) 来 标识 每 一 个 字 。 


5.3.2 ”存储 器 的 类 型 


主要 有 两 种 类 型 的 存储 器 : RAM 和 ROM。 

1. RAM 

随机 存 取 存储 器 (RAM) 是 计算 机 中 主 存 的 主要 组 成 部 分 。 在 随机 存 取 设备 中 ， 可 以 使 
用 存储 单元 地 址 来 随机 存 取 一 个 数据 项 ， 而 不 需要 存 取 位 于 它 前 面 的 所 有 数据 项 。 该 术语 有 
时 因为 ROM 也 能 随机 存 取 而 与 ROM 混淆 ，RAM 和 ROM 的 区 别 在 于 ， 用 户 可 读 写 RAM ， 
即 用 户 可 以 在 RAM 中 写 信息 ， 之 后 可 以 方便 地 通过 覆盖 来 擦 除 原 有 信息 。RAM 的 另 一 个 
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特点 是 易 失 性 。 当 系统 断 电 后 ， 信 息 (程序 或 数据 ) 将 丢失 。 换 句 话 说 ， 当 计算 机 断 电 后 ， 
存储 在 RAM 中 的 信息 将 被 删除 。RAM 技术 又 可 以 分 为 两 大 类 : SRAM 和 DRAM。 

(1) SRAM 

静态 RAM ( SRAM) 技术 是 用 传统 的 触发 器 门 电路 ( 见 附 录 卫 ) 来 保存 数据 。 这 些 门 保 
持 状态 (0 或 1 )， 也 就 是 说 当 通 电 的 时 候 数据 始终 存在 ， 不 需要 刷新 。SRAM 速度 快 ， 但 是 
价格 昂贵 。 

(2 ) DRAM 

动态 RAM (DRAM) 技术 使 用 电容 器 。 如 果 电 容器 充电 ， 则 这 时 的 状态 是 1 ; 如 果 放 
电 则 状态 是 0。 因 为 电容 器 会 随时 间 而 漏 掉 一 部 分 电 ， 所 以 内 存单 元 需要 周期 性 地 刷新 。 
DRAM 比较 慢 ， 但 是 比较 便宜 。 

2. ROM 

只 读 存 储 器 (ROM) 的 内 容 是 由 制造 商 写 进去 的 。 用 户 只 能 读 但 不 能 写 ， 它 的 优点 是 非 
易 失 性 : 当 切 断 电源 后 ， 数 据 也 不 会 丢失 。 通 常用 来 存储 那些 关机 后 也 不 能 丢失 的 程序 或 数 
据 。 例 如 ， 用 ROM 来 存储 那些 在 开机 时 运行 的 程序 。 

3. PROM 

称 为 可 编程 只 读 存 储 器 (PROM) 的 一 种 ROM。 这 种 存储 器 在 计算 机 发 货 时 是 空白 的 。 
计算 机 用 户 借助 一 些 特 殊 的 设备 可 以 将 程序 存储 在 上 面 。 当 程序 被 存储 后 ， 它 就 会 像 ROM 
一 样 不 能 够 重 写 。 也 就 是 说 ， 计 算 机 使 用 者 可 以 用 它 来 存储 一 些 特定 的 程序 。 

4. EPROM 

称 为 可 擦 除 可 编程 只 读 存 储 器 (EPROM) 的 一 种 PROM。 用 户 可 以 对 它 进行 编程 ， 但 
是 得 用 一 种 可 以 发 出 紫外 光 的 特殊 仪器 对 其 擦 写 。EPROM 存储 器 需要 拆 下 来 擦 除 再 重新 
安装 。 

5. EEPROM 

称 为 电 可 擦 除 可 编程 只 读 存 储 器 ( EEPROM) 的 一 种 EPROM。 对 它 的 编程 和 擦 除 用 电 
子 脉冲 即 可 ， 无 须 从 计算 机 上 拆 下 来 。 


5.3.3 ”存储 器 的 层次 结构 


计算 机 用 户 需要 许多 存储 器 ， 尤 其 是 速度 快 且 价格 低廉 的 存储 器 。 但 这 种 要 求 并 不 总 能 
得 到 满足 。 存 取 速 度 快 的 存储 器 通常 都 不 便宜 。 因 此 需要 寻找 一 种 折 中 的 办 法 。 解 决 的 办 法 
是 采用 存储 器 的 层次 结构 (图 5-4 ) 。 该 层次 结构 图 如 下 。 
e 当 对 速度 要 求 很 苛刻 时 可 以 使 用 少量 高 速 存 储 器 。CPU 中 的 寄存 器 就 是 这 种 存储 器 。 
e 用 适量 的 中 速 存 储 器 来 存储 经 常 需要 
访问 的 数据 。 例 如 下 面 将 要 讨论 的 高 
速 缓冲 存储 器 就 属于 这 一 类 。 
。 用 大 量 的 低速 存储 器 存储 那些 不 经 常 
访问 的 数据 。 主 存 就 属于 这 一 类 。 


5.3.4 ”高速 缓冲 存储 器 


高 速 缓冲 存储 器 的 存 取 速度 要 比 主 存 快 ， 最 便宜 
但 是 比 CPU 及 其 内 部 的 寄存 器 要 慢 。 高 速 组 图 5-4 存储 器 的 层次 
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冲 存储 器 通常 容量 较 小 ， 且 常 被 置 于 CPU 和 主 存 之 间 (图 5-5 )。 

高 速 缓冲 存储 器 在 任何 时 间 都 含有 主 存 中 一 部 分 内 容 的 副本 。 当 CPU 要 存 取 主 存 中 的 
一 个 字 的 时 候 9 将 按 以 下 步 又 进行 : CPU 

1 ) CPU 首先 检查 高 速 缓冲 存储 器 。 

2 ) 如 果 要 存 取 的 字 存 在 ，CPU 就 将 它 
复制 ; 如 果 不 存在 ，CPU 将 从 主 存 中 复制 
一 份 从 需要 读 取 的 字 开 始 的 数据 块 。 该 数 


主 存 





控制 单元 


据 块 将 覆盖 高 速 缓冲 存储 器 中 的 内 容 。 rr 
oP Oe 
AAA 0 


这 种 方式 将 提高 运算 的 速度 ; 如 果 字 在 高 速 缓冲 存储 器 中 ， 就 立即 存 取 它 。 如 果 字 不 在 
高 速 缓冲 存储 器 中 ， 字 和 整个 数据 块 就 会 被 复制 到 高 速 缓冲 存储 器 中 。 因 为 很 有 可 能 CPU 
在 下 次 存 取 中 需要 存 取 上 次 存 取 的 第 一 个 字 的 后 续 字 ， 所 以 高 速 缓冲 存储 器 可 以 大 大 提高 处 
理 的 速度 。 

读者 可 能 会 奇怪 为 什么 高 速 缓冲 存储 器 尽管 存储 容量 小 效率 却 很 高 ， 这 是 由 于 80-20 
规则 。 据 观察 ， 通 常 计 算 机 花费 80% 的 时 间 来 读 取 20% 的 数据 。 换 句 话 说， 相同 的 数 
据 往 往 被 存 取 多 次 。 高 速 缓冲 存储 器 ， 和 凭借 其 高 速 ， 可 以 存储 这 20% 的 数据 而 使 存 取 至 
少 快 80%。 


5.4 输入 / 输出 子 系统 


计算 机 中 的 第 三 个 子 系统 是 称 为 输入 / 输出 (IO) 子 系统 的 一 系列 设备 。 这 个 子 系统 可 
以 使 计算 机 与 外 界 通 信 ， 并 在 断 电 的 情况 下 存储 程序 和 数据 。 输 入 /输出 设备 可 以 分 为 两 大 
类 : 非 存储 设备 和 存储 设备 。 


5.4.1 非 存 储 设 备 


非 存储 设备 使 得 CPU/ 内 存 可 以 与 外 界 通信 ， 但 它们 不 能 存储 信息 。 

1. 键盘 和 监视 器 

两 个 最 常见 的 非 存储 输入 /输出 设备 是 键盘 和 监视 器 。 键 盘 提供 输入 功能 ; 监视 器 显示 
输出 并 同时 响应 键盘 的 输入 。 程 序 、 命 令 和 数据 的 输入 或 输出 都 是 通过 字符 串 进行 的 。 字 符 
则 是 通过 字符 集 (如 ASCII 码 ) 进行 编码 (参见 附录 A)。 此 类 中 其 他 的 设备 有 鼠标 、 操 纵 
杆 等 。 

2. 打印 机 

打印 机 是 一 种 用 于 产生 永久 性 记录 的 输出 设备 。 它 是 非 存储 设备 ， 因 为 要 打印 的 材料 不 
能 够 直接 由 打印 机 输入 计算 机 中 ， 而 且 也 不 能 再 次 利用 ， 除 非 有 人 通过 打字 或 扫描 的 方式 再 
次 输入 计算 机 中 。 


5.4.2 ”存储 设备 


尽管 存储 设备 被 分 为 输入 /输出 设备 ， 但 它 可 以 存储 大 量 的 信息 以 备 后 用 。 它 们 要 比 主 
存 便宜 得 多 ， 而 且 存 储 的 信息 也 不 易 丢 失 〈 即 使 断 电 信息 也 不 会 丢失 )。 有 时 称 它 们 为 辅助 
存储 设备 ， 通 常 分 为 磁 介 质 和 光 介质 两 种 。 
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1. 磁 介质 存储 设备 

磁 介 质 存储 设备 使 用 磁性 来 存储 位 数据 。 如 果 一 点 有 磁性 则 表示 1， 如 果 没 有 磁性 则 表 
不 06。 

(1) 磁盘 

磁盘 是 由 一 张 一 张 的 磁 片 琶 加 而 成 的 。 这 些 磁 片 由 薄 磁 膜 封 装 起 来 。 信 息 是 通过 盘 上 每 
一 个 磁 片 的 读 / 写 磁头 读 写 磁 介质 表面 来 进行 读 取 和 存储 的 。 图 5-6 给 出 了 磁盘 驱动 的 物理 
布局 和 磁盘 的 组 织 。 


磁道 肩 区 





磁盘 & 





= 一直 磁道 问 
读 / 写 头 的 间隔 扁 区 间 
司 磁盘 驱动 b) 磁道 和 肩 区 的 间隔 
图 5-6 磁盘 


e- 表面 结构 。 为 了 将 数据 存储 在 磁盘 的 表面 ， 每 个 盘面 都 被 划分 成 磁道 ， 每 个 磁道 又 
分 成 若干 个 扇 区 (图 5-6 ) 。 磁 道 间 通 过 磁道 内 部 间隔 隔 开 ， 扇 区 之 间 通 过 扇 区 内 部 
间隔 隔 开 。 

e 数据 存 取 。 人 磁盘 是 一 个 随机 存 取 设备 。 在 随机 存 取 设备 中 ， 数 据 项 可 以 被 随机 存 取 ， 
而 不 需要 存 取 放置 在 其 前 的 所 有 其 他 数据 。 但 是 ， 在 某 一 时 间 可 以 读 取 的 最 小 的 存 
储 区 域 只 能 是 一 个 扇 区 。 数 据 块 可 以 存储 在 一 个 或 多 个 扇 区 上 ， 而 且 该 信息 的 获取 
不 需要 通过 读 取 磁盘 上 的 其 他 信息 。 

e 性 能 。 磁 盘 的 性 能 取决 于 几 个 因素 : 最 重要 的 因素 是 角速度 、 寻 道 时 间 和 传送 时 间 。 
角速度 定义 了 磁盘 的 旋转 速度 。 寻 道 时 间 定 义 了 读 / 写 磁头 寻找 数据 所 在 磁道 的 时 
间 。 传 送 时 间 定 义 了 将 数据 从 磁盘 移 到 CPU/ 内 存 所 需要 的 时 间 。 

(2 ) 磁带 

磁带 大 小 不 一 。 最 普通 的 一 种 是 用 厚 磁 膜 封 装 的 半 英 寸 塑 料 磁带 。 磁 带 用 两 个 滚轮 承接 

起 来 ， 当 转动 的 磁带 通过 读 / 写 磁头 的 时 候 ， 就 可 以 通过 磁头 来 读 写 磁带 上 的 数据 。 图 5-7 
展示 了 磁带 的 机 械 构造 。 
磁带 盘 收 起 盘 





磁道 9 





E 

读 / 写 头 

a) 磁盘 驱动 b) 表面 结构 
图 5-7 磁带 


。 表面 结构 。 磁 带 的 宽度 可 以 分 为 9 个 磁道 ;磁道 上 的 每 个 点 可 以 存储 1 位 的 信息 。 垂 
直 切 面 的 9 个 点 可 以 存储 8 位 〈 即 1 字 节 ) 的 信息 ， 还 有 1 位 用 作 错 误 检测 (图 5-7 )。 
。 数据 存 取 。 磁 带 是 顺序 存 取 设备 。 尽 管 磁带 的 表面 可 能 会 分 成 若干 块 ， 但 是 却 没有 
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寻 址 装置 来 读 取 每 个 块 。 要 想 读 取 指定 的 块 就 需要 按照 顺序 通过 其 前 面 所 有 的 块 。 

e 性 能 。 尽 管 磁带 的 速度 比 磁盘 慢 ， 但 它 非常 便宜 。 现 在 ， 人 们 使 用 磁带 来 存储 大 容 
量 的 数据 。 

2. 光 存 储 设备 

光 存 储 设备 是 一 种 新 技术 ， 它 使 用 光 (激光 ) 技术 来 存储 和 读 取 数据 。 在 发 明了 CD ( 光 

盘 ) 后 人 们 利用 光 存 储 技术 来 保存 音频 信息 。 现 在 ， 相 同 的 技术 ( 稍 作 改 进 ) 被 用 于 存储 计 

算 机 上 的 信息 。 使 用 这 种 技术 的 设备 有 只 读 光盘 (CD-ROM)、 可 刻录 光盘 (CD-R)、 可 重 写 

光盘 (CD-RW)、 数 字 多 功能 光盘 (DVD )。 

(1) CD-ROM 
只 读 光 盘 ( CD-ROM) 使 用 与 CD (光盘 ) 相同 的 技术 (该 技术 最 初 是 由 飞利浦 和 索尼 公 

司 为 录制 音乐 而 研发 的 ) 。 两 者 间 唯 一 的 区 

别 在 于 增强 程度 不 同 ; CD-ROM 更 健壮 ， 而 

且 纠 错 能 力 较 强 。 图 5-8 给 出 了 制造 和 使 用 

CD-ROM 的 步骤 。 

e 制造 。CD-ROM 技术 需要 分 三 步 来 a) 主 盘 
制造 大 量 的 光盘 : 

a. 首先 是 使 用 高 能 红外 激光 在 塑料 涂 
层 上 刻写 位 模式 来 制造 主 盘 。 激 一 
光束 使 位 模式 变 成 一 系列 的 坑 (有 
洞 ) 和 纹 间 表面 (没有 洞 )。 坑 通 
常 表示 0， 纹 间 表 面 则 通常 表示 六 竹下 
1。 但 这 也 只 是 一 种 规则 ， 也 可 以 加 醒 醒 
反 过 来 表示 。 男 一 种 方法 是 将 过 BR 
渡 部 分 ( 坑 到 洞 或 者 洞 到 坑 ) 表示 
1， 而 非 过 渡 部 分 表示 0。 

b. 然 后 依照 主 盘 ， 做 成 相应 的 模 
盘 。 在 模 盘 中 , 坑 ( 洞 ) 则 由 凸 起 oj CD-ROM 
代替 。 、 

c. 溶解 的 取 碳 酸 本 树脂 被 注 人 模 盘 中 。 “制造 和 使 用 CD-ROM 的 此 
以 产生 像 主 盘 中 一 样 的 坑 ， 同 时 把 一 层 非常 薄 的 铝 (作为 一 层 反 射 表 面 ) 加 到 聚 碳 
酸 酯 树脂 上 ， 然 后 在 反射 表面 的 上 面 还 要 加 上 一 层 保 护 漆 和 标签 。 在 制造 光盘 中 
只 有 这 一 步 对 于 每 一 张 光盘 都 需要 。 

读 。CD-ROM 依靠 来 自 计算 机 光驱 的 低能 激光 束 读 信息 ， 激 光束 经 过 有 纹 间 表 面 时 

会 被 铝 质 的 表 射 层 反 射 回 来 。 经 过 坑 处 时 会 被 反射 两 次 ， 一 次 是 被 坑 的 边缘 反射 ， 

另外 一 次 是 被 铝 质 表 射 层 的 边界 反射 ， 这 两 次 反射 有 破坏 性 的 影响 。 因 为 坑 的 深度 

是 精确 选 定 的 ， 为 激光 束 波长 的 1/4。 换 言 之 ， 装 在 驱动 器 上 的 感应 器 对 于 某 个 点 是 

纹 间 表面 时 ， 应 该 探测 到 多 一 些 的 光 信 和 号， 反之 是 坑 时 就 少 一 点 ; 这 样 它 才 可 以 读 

出 记录 在 原始 主 盘 上 的 信息 。 

格式 。CD-ROM 工艺 使 用 和 磁盘 不 同 的 格式 (图 5-9 )。CD-ROM 的 格式 是 基于 : 

a. 使 用 汉 明 码 的 纠 错 技术 将 8 位 的 数据 块 转换 成 14 位 的 符号 。 


纹 间 表 面 纹 间 表 面 。 纹 间 表面 ” 纹 间 表面 纹 间 表 面 








b) 模 盘 
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b. 一 个 帧 由 42 个 符号 组 成 (14 位 /符号 )。 
c. 一 个 扇 区 是 由 98 个 帧 组 成 (2352 个 位 )。 





口 字 节 (8 位 ) 
帧 ( 42 个 符号 ) 
扇 区 (98 帧 ) 


图 $-9 CD-ROM 的 格式 


e 速度 。CD-ROM 驱动 器 有 不 同 的 速度 ， 单 倍速 称 为 1x，2 倍速 称 为 2x， 以 此 类 推 。 
如 果 驱 动 器 是 单 倍速 的 ， 它 的 读 取 速 度 是 153 600 字 节 / 秒 。 表 5-2 给 出 了 不 同 的 速 
度 和 相应 的 数据 传输 速率 。 


表 5-2 CD-ROM 的 速度 


eo | 
| 

















1.8 MB/s 
2.4 MB/s 


614 400 字 节 / 秒 600 KB/s 3 688 400 字 节 / 秒 
921 600 字 节 / 秒 900 KB/s 4 915 200 字 节 / 秒 
1 228 800 字 节 / 秒 1.2 MB/s 6 144 000 字 节 / 秒 


e 应 用 。 如 果 有 大 量 的 潜在 的 客户 ， 那 么 制造 主 盘 、 模 盘 和 实际 的 光盘 所 需 的 费用 是 
可 以 调节 的 。 换 言 之 ， 如 果 大 量 生产 盘 片 ， 那 么 这 项 技术 是 非常 经 济 的 。 
(2 ) CD-R 
就 如 前 面 所 述 ，CD-ROM 技术 只 有 在 生产 商 大 批量 生产 时 才 合 理 。 另 一 方面 ， 可 刻录 
光盘 (CD-R) 则 可 以 让 用 户 自己 制作 一 张 或 更 多 的 盘 片 ， 而 不 必 考 虑 像 制 作 CD-ROM 时 的 
一 些 开 销 。 它 非常 适合 做 备份 ， 用 户 只 需要 一 次 写 和 信息， 就 可 以 多 次 读 取信 息 。 这 也 是 它 
为 什么 有 时 被 称 为 “ 写 一 次 ， 读 多 次 "(WORM) 的 原因 。 
e 制造 。 可 刻录 光盘 使 用 的 技术 与 制作 只 读 光 盘 的 原理 相同 (图 5-10 )。 下 面 是 一 些 不 
同 之 处 : 
a. 不 需要 主 盘 和 模 盘 。 
b. 反射 层 材 料 用 金 取 代 了 铝 。 
c. 盘 片 聚 碳酸 酯 树脂 上 没有 坑 
( 洞 )， 盘 片 上 的 坑 和 纹 间 表 
面 是 模拟 出 来 的 。 为 了 模拟 
坑 和 纹 间 表面 ， 在 聚 碳酸 酷 ”激光 探测 器 
和 反射 层 之 间 额 外 添加 了 类 i 
似 用 于 相片 中 的 某 种 染料 。 
d. 由 刻录 机 所 产生 的 高 能 激光 束 在 染料 层 上 烧 制 深 色 的 点 (改变 化 学 组 成 )， 用 来 模 
拟 坑 ， 没 有 被 激光 所 照射 的 区 域 就 是 纹 间 表面 。 


4.8 MB/s 
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e 读 。CD-R 上 的 信息 可 以 由 CD-ROM 驱动 器 和 CD-R 驱动 器 读 取 。 这 就 意味 着 任何 
的 差别 对 于 驱动 器 来 说 都 应 该 是 透明 的 。 相 同 的 低能 激光 束 经 过 模拟 的 坑 和 纹 间 表 
面 ， 对 纹 间 表面 而 言 ， 激 光束 到 达 反 射 层 而 被 反射 ; 而 对 模拟 的 坑 而 言 ， 点 是 不 透 
明 的 ， 所 以 激光 束 不 会 被 反射 回来 。 

e 格式 和 速度 。CD-R 的 格式 、 容 量 和 速度 与 CD-ROM 的 相同 。 

e 应 用 。 这 项 技术 对 那些 想 制作 和 发 布 少量 光盘 的 用 户 非常 有 吸引 力 ， 同 时 它 也 非常 

适合 用 于 制作 档案 文件 和 备份 。 

(3) CD-RW 

尽管 CD-R 已 很 受 欢 迎 ， 但 它们 只 能 被 写 一 次 。 为 了 能 重 写 以 前 的 资料 ， 便 有 了 一 项 新 
的 技术 ， 利 用 该 技术 可 以 制作 一 种 称 为 可 重 写 光盘 (CD-RW) 的 新 盘 ， 有 时 我 们 也 称 为 可 擦 
写 光 盘 。 

e 制造 。CD-RW 使 用 的 技术 与 
制作 可 刻录 光盘 的 原理 相同 
(图 5-11)。 下 面 是 一 些 不 同 
之 处 : pe 
a. 该 工艺 使 用 了 银 、 铀 、 匀 和 晶体 态 〈 纹 间 表 面 ) Ee 

磅 的 合金 而 不 是 染料 。 这 种 
合金 材料 有 两 种 稳定 的 状 
态 : 晶体 态 (透明 态 ) 和 无 
定型 态 (不 透明 态 )。 
b. 驱动 器 使 用 高 能 激光 束 在 合金 上 创建 模拟 的 坑 (由 晶体 态 变 成 无 定型 态 )。 
读 。 了 驱动 器 使 用 与 CD-ROM 和 CD-R 一 样 的 低能 激光 束 来 检测 是 坑 还 是 纹 间 表面 。 
擦 除 。 驱 动 器 使 用 中 等 能 量 的 激光 束 将 坑 变 成 纹 间 表面 ， 激 光束 将 该 点 从 无 定型 态 
转变 成 晶体 态 。 
e 格式 和 速度 。CD-RW 的 格式 、 容 量 和 速度 与 CD-ROM 的 相同 。 
应 用 。 这 项 技术 明显 比 CD-R 技术 更 有 吸引 力 。 尽 管 如 此 ，CD-R 还 是 更 受 欢迎 一 
些 。 原 因 有 以 下 两 点 : 第 一 ，CD-R 空 盘 价 格 比 CD-RW 空 盘 的 价格 要 便宜 ; 第 二 ， 
CD-R 在 某 些 不 容许 改变 光盘 内 容 的 场合 下 更 合适 ， 不 论 是 无 意 还 是 有 意 的 改变 。 

(4) DVD 

工业 界 已 经 感到 了 对 更 大 存储 容量 的 数字 存储 媒介 的 需求 。CD-ROM (650 MB) 的 存 
储 容量 已 经 不 能 满足 视频 信息 存储 的 需要 。 市 场 上 最 新 的 光 存 储 设备 叫做 数字 多 功能 光盘 
(DVD)。 它 使 用 类 似 于 CD-ROM 的 技术 ,但 是 又 有 以 下 的 不 同 : 

a. 坑 更 小 : 直径 只 有 0.4 微米 ， 而 CD 中 直径 为 0.8 微米 。 

b. 磁道 间 更 为 紧密 。 

c. 激光 束 用 红 激 光 代替 了 红外 激光 。 

d. DVD 使 用 1 ~ 2 个 存储 层 ， 并 且 可 以 是 单 面 或 者 双 面 的 。 

。 容量 。 上 述 的 技术 改进 导致 了 容量 的 增 大 ( 表 5-3 )。 

e 压缩 。 DVD 技术 用 MPEG (参见 第 15 章 ) 压缩 。 这 就 意 

味 着 一 个 单 面 、 单 层 的 DVD 可 以 存储 133 分 钟 (2 小 时 13 
分 钟 ) 的 高 品质 视频 。 其 中 还 包括 音频 和 字幕 。 





图 5-11 制作 CD-RW 


表 5-3 DVD 容量 
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e 应 用 。 如 今 ，DVD 以 其 大 容量 应 用 于 许多 需要 存储 大 容量 数据 的 应 用 程序 中 。 


5.5 子 系 统 的 互 连 
前 面 的 几 节 中 已 经 介绍 了 在 单个 计算 机 上 的 三 个 子 系统 (CPU、 主 存 和 输入 /输出 ) 的 


主要 特点 。 本 节 将 介绍 它们 三 者 之 间 在 内 部 是 如 何 连接 的 ， 内 部 连接 扮演 着 很 重要 的 角色 ， 
因为 信息 需要 在 这 三 个 子 系统 中 交换 。 


5.5.1 CPU 和 存储 器 的 连接 


CPU 和 存储 器 之 间 通 常 由 称 为 总 线 的 三 组 线路 连接 在 一 起 ， 它 们 分 别 是 : 数据 总 线 、 
地 址 总 线 和 控制 总 线 (图 5-12 )。 


CPU 数据 总 线 内 存 





par 
图 5-12 使 用 三 种 总 线 连 接 CPU 和 存储 器 


1. 数据 总 线 

数据 总 线 是 由 多 根 线 组 成 ， 每 一 根 线 上 每 次 传送 1 位 的 数据 。 线 的 数量 取决 于 计算 机 的 
字 的 大 小 。 例 如 ， 计算机 的 字 是 32 位 (4 字 节 )， 那 么 需要 有 32 根 线 的 数据 总 线 ， 以 便 同 一 
时 刻 能 够 同时 传送 32 位 的 字 。 

2. 地 址 总 线 

地 址 总 线 允 许 访问 存储 器 中 的 某 个 字 ， 地 址 总 线 的 线 数 取 决 于 存储 空间 的 大 小 。 如 果 存 
储 器 容量 为 2" 个 字 ， 那 么 地 址 总 线 一 次 需要 传送 n 位 的 地 址 数据 。 因 此 它 需 要 n 根 线 。 

3. 控制 总 线 

控制 总 线 负 责 在 中 央 处 理 器 和 内 存 之 间 传 送信 息 。 例如 ， 必 须 有 一 个 代码 从 CPU 发 往 
内 存 ， 用 于 指定 进行 的 是 读 操作 还 是 写 操作 。 控 制 总 线 的 线 数 取决 于 计算 机 所 需要 的 控制 命 
令 的 总 数 。 如 果 计 算 机 有 2” 条 控制 命令 ,那么 控制 总 线 就 需要 有 m 根 ， 因 为 m 位 可 以 定义 
27 个 不 同 的 操作 。 


5.5.2 IO 设备 的 连接 


输入 /输出 设备 不 能 够 直接 与 连接 CPU 和 内 存 的 总 线 相 连 。 因 为 输入 /输出 设备 的 本 质 
与 CPU 和 内 存 的 本 质 不 同 ,输入 /输出 设备 都 是 些 机 电 、 磁 性 或 光学 设备 ， 而 CPU 和 内 存 
是 电子 设备 。 与 CPU 和 内 存 相 比 ,输入 /输出 设备 的 操作 速度 要 慢 得 多 。 因 此 必须 要 有 中 
介 来 处 理 这 种 差异 ， 输 入 /输出 设备 是 通过 一 种 被 称 为 输入 /输出 控制 器 或 接口 的 器 件 连 接 
到 总 线 上 的 。 每 一 个 输入 /输出 设备 都 有 一 个 特定 的 控制 器 (图 5-13 )。 

控制 器 

控制 器 ， 或 者 说 接口 ， 清 除了 输入 /输出 设备 与 CPU 及 内 存在 本 质 上 的 障碍 。 控 制 器 
可 以 是 串 行 或 并 行 的 设备 。 串 行 控制 器 则 只 有 一 根 数据 线 连 接 到 设备 上 ， 而 并 行 控制 器 则 有 
数 根 数据 线 连 接 到 设备 上 ， 使 得 一 次 能 同时 传送 多 个 位 。 

有 几 种 控制 器 至 今 还 在 使 用 ， 如 今 最 常用 的 有 SCSI、 火 线 、USB 和 HDMI。 
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5-13 1/O 设备 与 总 线 的 连接 


(1) SCSI 

小 型 计算 机 系统 接口 (SCSI) 最 初 是 1984 年 为 Macintosh 计算 机 而 设计 的 。 今 天 还 有 
许多 系统 使 用 它 。 它 是 一 个 8、16 或 32 线 的 并 行 接口 。SCSI 接口 如 图 5-14 所 示 ， 它 提供 了 菊 
花 链 连接 ， 连 接 链 的 两 端 都 必须 有 终结 器 ， 并 且 每 个 设备 都 必须 要 有 唯一 的 地 址 〈 目 标 ID)。 


终端 
ID=4 





a 
磁盘 CD-ROM 扫描 仪 磁带 一 
图 5-14 SCSI 控制 器 


(2 ) 火线 

IEEE 标准 1394 规定 的 串 行 接口 ， 俗 称 为 火线 。 它 是 一 种 高 速 的 串 行 接口 ， 数 据 采用 数 
据 包 的 形式 传送 ， 数 据 的 传输 速度 高 达 50 MB/s， 然 而 对 于 版 本 最 新 的 数据 线 ， 这 个 速度 可 
以 翻 一 倍 。 它 可 以 在 一 条 菊花 链 或 树 形 连接 (只 用 一 根 线 ) 上 连接 多 达 63 个 设备 。 图 5-15 
给 出 了 输入 /输出 设备 和 火线 控制 器 的 连接 。 和 SCSI 相 比 ， 它 不 需要 终结 器 。 





图 5-15 ”火线 控制 器 
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(3) USB 

通用 串 行 总 线 (USB) 控制 器 是 一 种 可 以 和 火线 控制 器 相 媲 美的 控制 器 。 虽 然 术 语 使 用 了 
词 bus， 但 USB 是 一 种 串 行 控制 器 ， 用 以 连接 与 计算 机 相连 的 一 些 低速 和 高 速 设备 。 图 5-16 
显示 了 USB 控制 器 与 总 线 间 的 连接 和 设备 与 控制 器 间 的 连接 。 





图 5-16 USB 控制 器 


多 个 设备 可 以 被 连接 到 一 个 USB 控制 器 上 ， 这 个 控制 器 也 称 为 根 集线器 。USB-2 (USB 
版 本 2.0 ) 允许 多 达 127 个 设备 组 成 树 状 拓扑 结构 连接 到 一 个 USB 控制 器 上 ， 其 中 控制 器 作 
为 树 的 根 ， 集 线 器 作为 中 间 节 点 ,设备 作为 末端 节点 。 控 制 器 ( 根 集线器 ) 与 其 他 集线器 的 
不 同 之 处 在 于 控制 器 能 感知 到 树 中 其 他 集线器 的 存在 ， 而 其 他 集线器 是 被 动 的 设备 ， 它 们 只 
是 简单 地 传送 数据 。 

设备 可 以 不 需要 关闭 计算 机 很 容易 地 被 移 除 或 连接 到 树 中 。 这 称 为 热 交 换 。 当 集线器 被 
从 系统 中 移 除 时 ， 与 此 集线器 相连 的 所 有 设备 和 其 他 集线器 也 被 移 除 。 

USB 使 用 4 根 线 的 电缆 。 两 根 线 (+5V 和 地 ) 被 用 来 为 像 键盘 和 鼠标 这 样 的 低压 设备 提 
供电 压 。 高 压 设备 需要 被 连接 到 电源 上 。 集 线 器 从 总 线 取得 电压 ， 能 为 低压 设备 提供 电压 。 
其 他 两 根 线 (缠绕 在 一 起 ， 以 减 小 噪声 ) 用 来 传送 数据 、 地 址 和 控制 信号 。USB 使 用 两 种 不 
同 的 连接 头 : A 和 B。 连 接头 A (下 游 连接 器 ) 是 和 矩形 的 ， 用 来 连接 到 USB 控制 器 或 集线器 。 
连接 头 B (上 游 连接 器 ) 是 接近 正方 形 的 ， 用 来 连接 到 设备 。 最 近 两 种 新 型 连接 器 (微型 A 
和 微型 B) 已 经 被 引入 ， 用 来 连接 小 设备 和 笔记 本 。 

USB-2 提供 三 种 传送 速率 : 1.5 Mbps (每 秒 兆 位 )、12 Mbps 和 480 Mbps。 低 速率 可 以 
用 于 低速 设备 ， 如 键盘 和 鼠标 ; 中 速率 用 于 打印 机 ; 高 速率 用 于 大 容量 的 存储 设备 。 

通过 USB 的 数据 是 以 包 (参见 第 6 章 ) 的 形式 传输 的 。 每 个 包含 有 : 地 址 部 分 (设备 标 
识 )、 控 制 部 分 、 要 被 传送 到 其 他 设备 的 数据 部 分 。 所 有 设备 将 接收 到 相同 的 包 ， 但 只 有 具 
有 数据 包 中 所 定义 的 地 址 的 那些 设备 将 接受 它 。 

USB 3.0 是 计算 机 连接 方 对 通用 串 行 总 线 (USB ) 标准 的 再 一 次 修订 。USB 3.0 增加 了 
一 个 新 的 叫做 “SuperSpeed”( 超 感 ) 的 传输 模式 ， 这 个 模式 可 以 将 数据 传输 的 速率 提升 至 
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4.8 Gbit/s。 根 据 承 诺 ，USB 3.0 的 速率 将 更 新 至 10 Gbit/s。 

(4) HDMI 

高 清晰 度 多 媒体 接口 ( HDMI) 是 现 有 视频 模拟 标准 的 数字 化 替代 品 。 它 可 以 用 来 从 一 
个 资源 向 另 一 个 兼容 的 计算 机 显示 器 、 视 频 投 影 仪 、 数 字 电 视 或 数字 音像 设备 传输 视频 数据 
和 数字 音像 数据 。 现 有 的 多 种 HDMI 标准 电缆 可 用 于 传输 包括 标准 、 加 强 、 高 清晰 以 及 3D 
画 质 的 视频 数据 ， 最 多 可 达 8 频道 的 压缩 或 未 压缩 数字 音频 ， 消 费 性 电子 控制 (CEC) 连接 ， 
并 且 可 用 于 以 太 网 络 数据 连接 。 


5.5.3 输入 /输出 设备 的 寻 址 


通常 CPU 使 用 相同 的 总 线 在 主 存 和 输入 /输出 设备 之 间 读 写 数据 。 唯 一 的 不 同 是 指令 。 
如 果 指 令 涉及 主 存 中 的 字 ， 那 么 数据 会 在 主 存 和 CPU 之 间 传 送 。 如 果 指 令 涉 及 输入 /输出 
设备 ， 那 么 数据 会 在 输入 / 输出 设备 和 CPU 之 间 传 送 。 有 两 种 方法 用 来 对 输入 /输出 设备 进 
行 寻 址 ， 即 WO 独立 寻 址 和 LO 存储 器 映射 寻 址 。 

1. IO 独立 寻 址 

在 VO 独立 寻 址 中 ， 用 来 读 / 写 内 存 的 指令 与 用 来 读 / 写 输入 /输出 设备 的 指令 是 完全 
不 同 的 。 有 专门 的 指令 完成 对 输入 /输出 设备 的 测试 、 控 制 以 及 读 写 操作 。 每 个 输入 /输出 
设备 有 自己 的 地 址 。 因 为 指令 的 不 同 ， 所 以 输入 /输出 地 址 可 以 和 内 存 地 址 重 和 到 而 不 会 产 
生 混 淆 。 例 如 ，CPU 可 以 使 用 读 命令 Read 101 来 从 内 存 中 读 取 字 101。 它 也 可 以 使 用 输入 
命令 Input 101 来 从 地 址 端口 为 101 的 输入 /输出 设备 中 读 取 数据 。 这 里 不 会 发 生 混 淆 ， 因 
为 Read 指令 是 规定 从 内 存 中 读 取 数据 ， 而 Input 指令 则 是 规定 从 输入 /输出 设备 中 读 取 数据 
(图 5-17 ) 。 





控制 器 
图 5-17 1/O 独立 寻 址 


2.1/0 存储 器 映射 寻 址 

在 1/O 存储 器 映射 寻 址 方式 中 ，CPU 将 输入 /输出 控制 器 中 的 每 一 个 寄存 器 都 看 作 内 存 
中 的 某 个 存储 字 。 换 言 之 ，CPU 没有 不 同 的 指令 用 来 表示 是 从 内 存 或 是 从 输入 /输出 设备 传 
送 数据 。 例 如 ， 在 指令 集中 只 有 一 条 Read 指令 ， 如 果 地 址 指定 的 是 内 存 中 的 某 个 单元 ， 则 
从 内 存 中 读 取 数据 。 如 果 地 址 指定 的 是 输入 /输出 设备 中 的 某 个 寄存 器 ， 那 么 就 从 寄存 器 中 
读 取 数据 。 存 储 器 映射 的 输入 /输出 的 配置 优点 在 于 有 一 个 较 小 的 指令 集 ， 所 有 对 内 存 的 操 
作 指 令 都 同样 适合 于 输入 /输出 设备 ， 其 缺点 是 输入 /输出 控制 器 占用 了 一 部 分 内 存 地址。 
例如 ， 假 使 有 5 个 输入 /输出 控制 器 ， 每 个 控制 器 有 4 个 寄存 器 ， 则 共 占 用 20 个 地 址 。 相 
应 的 内 存 的 大 小 就 减 小 了 20 个 字 。 图 5-18 给 出 了 IO 存储 器 映射 的 概念 。 
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控制 器 
图 5-18 ”1/O 存储 器 映射 寻 址 


5.6 程序 执行 

当今 ， 通 用 计算 机 使 用 称 为 程序 的 一 系列 指令 来 处 理 数据 。 计 算 机 通过 执行 程序 ， 将 输 
入 数据 转换 成 输出 数据 。 程 序 和 数据 都 放 在 内 存 中 。 
5.6.1 机 器 周期 


CPU 利用 重复 的 机 器 周期 来 执行 程序 中 的 指令 ， 一 步 一 条 ， 从 开始 到 结束 。 一 个 简化 
的 周期 包括 3 步 : 取 指 令 、 译 码 和 执行 (图 5-19 ) 。 





译 码 


取 指 令 |{ 机 器 周期 】 执 行 





图 5-19 ”机 器 周期 的 步骤 


1. 取 指令 

在 取 指 令 阶 段 ， 控 制 单元 命令 系统 将 下 一 条 将 要 执行 的 指令 复制 到 CPU 的 指令 寄存 器 
中 。 被 复制 的 指令 地 址 保存 在 程序 计数 器 中 。 复 制 完成 后 ， 程 序 计数 器 自动 加 1 指向 内 存 中 
的 下 一 条 指令 。 

2. 译 码 

机 器 周期 的 第 二 阶段 是 译 码 阶段 。 当 指令 置 于 指令 寄存 器 后 ， 该 指令 将 由 控制 单元 负责 
译 码 。 指 令 译 码 的 结果 是 产生 一 系列 系统 可 以 执行 的 二 进 制 代码 。 

3. 执行 

指令 译 码 完毕 后 ， 控 制 单元 发 送 任务 命令 到 CPU 的 某 个 部 件 ， 例 如 ， 控 制 单元 告知 系 
统 ， 让 它 从 内 存 中 加 载 ( 读 ) 数据 项 ,或 者 是 CPU 让 算术 逻辑 单元 将 两 个 输入 寄存 器 中 的 内 
容 相 加 并 将 结果 保存 在 输出 寄存 器 。 这 就 是 执行 阶段 。 
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5.6.2 输入 /输出 操作 


计算 机 需要 通过 命令 把 数据 从 IO 设备 传输 到 CPU 和 内 存 。 因 为 输入 /输出 设备 的 运行 
速度 比 CPU 慢 得 多 ， 因 此 CPU 的 操作 在 某 种 程度 上 必须 和 输入 /输出 设备 同步 。 有 三 种 方 
法 被 设计 用 于 同步 ， 分 别 为 : 程序 控制 输入 /输出 、 中 断 控制 输入 /输出 、 直 接 存储 器 存 取 
(DMA)。 

1. 程序 控制 输入 /输出 

在 程序 控制 输入 /输出 中 ,采用 最 简单 
的 一 种 同步 : CPU 等 待 IO 设备 (图 5-20 )。 

CPU 和 IO 设备 之 间 的 数据 传输 是 通 
过 程序 中 的 指令 实现 的 。 当 CPU 遇 到 一 条 
IO 指令 时 ， 它 就 停止 工作 直到 数据 传输 完 
毕 。CPU 不 时 地 查询 IO 设备 的 状态 : 如 
果 设 备 做 好 了 传输 准备 ， 那 么 数据 将 被 传 
送 到 CPU ; 如 果 设 备 没 有 做 好 传输 准备 ， 
那么 CPU 将 继续 查询 IO 设备 的 状态 直到 
IO 设备 准备 好 为 止 。 这 种 方法 存在 的 最 
大 问题 就 是 ， 当 每 一 个 单元 数据 被 传输 时 ， 
CPU 都 要 浪费 时 间 去 查询 IO 的 状态 。 要 
注意 的 是 ， 数 据 在 输入 操作 后 被 传送 到 内 
存 ， 在 输出 操作 前 则 是 从 内 存 中 取出 。 

2. 中 断 控 制 输入 / 输出 图 5-20 程序 控制 输入 /输出 

在 中 断 控制 输入 /输出 中 , 首先 CPU 告知 1/0 设备 即将 开始 传输 ， 但 是 CPU 并 不 需要 
不 停 地 查询 IO 设备 的 状态 。 当 IO 设备 准备 好 时 ， 它 通知 (中 断 ) CPU。 在 这 过 程 中 ， 
CPU 还 可 以 做 其 他 工作 。 例 如 ， 运 行 其 他 
程序 ， 从 其 他 的 IO 设备 读 入 或 传 出 数据 开始 
(图 5-21 )。 

在 这 种 方法 中 ，CPU 时 间 没 有 被 浪费 。 
当 慢 速 的 IO 设备 正在 完成 一 项 任务 时 ， 
CPU 可 以 做 其 他 工作 。 注 意 ， 像 程序 控制 
输入 /输出 一 样 ， 这 种 方法 也 在 IO 设备 和 
CPU 之 间 传 输 数 据 。 数 据 在 输入 操作 后 被 
传送 到 内 存 ， 在 输出 操作 前 则 是 从 内 存 中 
取出 。 

3. 直接 存储 器 存 取 (DMA) 

第 三 种 传输 数据 的 方法 是 直接 存储 器 
存 取 ( DMA)。 这 种 方法 用 于 在 高 速 1O 设 ， 内 5-21 中 断 各 制 输入 /输出 
备 间 传输 大 量 的 数据 块 ， 例 如 磁盘 、 内 存 (不 需要 通过 CPU 的 数据 传输 )。 这 种 方法 需要 一 
个 DMA 控制 器 来 承担 CPU 的 一 些 功能 。DMA 控制 器 中 有 寄存 器 ， 可 以 在 内 存 传输 前 后 保 
存 数据 块 。 图 5-22 给 出 了 DMA 与 数据 、 地 址 和 控制 总 线 的 连接 情况 。 






[更 多 字 ? ] 


遇 到 一 条 输 上 
一 入 /输出 指令 









“| 继续 程序 中 
的 下 一 条 指令 


[更 多 字 ? ] 停止 
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数据 块 传输 (5) 





图 5-22 DMA 和 一 般 总 线 的 连接 


在 使 用 这 种 方法 进行 IO 操作 时 ，CPU 发 
送信 息 给 DMA。 这 信息 包括 传输 类 型 (输入 下 妈 加 一 
或 输出 )、 内 存单 元 的 起 始 地 址 以 及 传输 的 字 节 
数 。 之 后 CPU 就 可 做 其 他 的 工作 (图 5-23 ) 。 人 

当 准 备 好 传输 数据 时 ， 则 由 DMA 控制 器 
通知 CPU 它 需 要 获得 总 线 的 使 用 权 。 这 时 CPU | < did 
停止 使 用 总 线 并 转交 给 DMA 控制 器 使 用 。 在 
内 存 和 DMA 间 的 数据 传输 完成 后 ，CPU 继续 
进行 正常 操作 。 需 要 注意 的 是 ， 在 这 种 方法 中 ， 
CPU 只 是 在 一 小 段 时 间 内 是 空闲 的 。CPU 仅 当 
在 DMA 和 内 存 间 传 输 数据 时 才 空 闸 ， 而 不 是 
在 设备 为 传输 数据 做 准备 时 。 停止 


5.7 不 同 的 体系 结构 图 5-23 DMA 输入 /输出 


在 最 近 几 十 年 中 ,计算 机 的 体系 结构 和 组 织 经 历 了 许多 变化 。 本 书 将 讨论 一 些 与 我 们 前 
面 讨论 的 简单 计算 机 体系 结构 所 不 同 的 常见 的 体系 结构 和 组 织 。 


5.7.1 CISC 


CISC ( 读 作 [sisk]) 是 复杂 指令 集 计算 机 ( complex instruction set computer) 的 缩写 。 
CISC 体系 结构 的 设计 策略 是 使 用 大 量 的 指令 ,包括 复杂 指令 。 和 其 他 设计 相 比 ,在 CISC 
中 进行 程序 设计 要 比 在 其 他 设计 中 容易 得 多 ， 因 为 每 一 项 简单 或 复杂 的 任务 都 有 一 条 对 应 的 
指令 。 程 序 员 不 需要 写 一 大 堆 指 令 去 完成 一 项 复杂 的 任务 。 

指令 集 的 复杂 性 使 得 CPU 和 控制 单元 的 电路 非常 复杂 。CISC 体系 结构 的 设计 者 已 经 
提出 减少 这 种 复杂 性 的 解决 方案 : 程序 在 两 个 层面 上 运行 。CPU 不 直接 执行 机 器 语言 指令 。 
CPU 只 执行 被 称 为 微 操作 的 简单 操作 。 复 杂 指 令 被 转化 为 一 系列 简单 操作 然后 由 CPU 执 
行 。 这 种 执行 机 制 需要 一 个 被 称 为 微 内 存 的 特殊 内 存 ， 它 负责 保存 指令 集中 的 每 个 复杂 指令 
的 一 系列 操作 。 使 用 微 操 作 的 程序 设计 被 称 为 微 程序 设计 。 

反对 CISC 体系 结构 的 一 个 理由 便 是 微 程序 设计 和 存 取 微 内 存 所 带 来 的 开销 。 然 而 ， 这 








< 一 一 一 一 中 断 ( DMA 已 经 完成 数据 传输 ) 
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种 体系 结构 的 支持 者 则 认为 这 使 得 程序 在 机 器 层 上 的 程序 更 简洁 。CISC 体系 结构 的 一 个 例 
子 便 是 英特尔 公司 所 开发 的 奔腾 系列 处 理 器 。 


5.7.2 RISC 


RISC ( 读 作 [risk]) 是 精简 指令 集 计 算 机 (reduce instruction set computer) 的 缩写 。RISC 
体系 结构 的 设计 策略 是 使 用 少量 的 指令 完成 最 少 的 简单 操作 。 复 杂 指 令 用 简单 指令 子 集 模 
拟 。 在 RISC 中 进行 程序 设计 比 在 其 他 设计 中 更 难 、 更 费时 ， 因 为 复杂 指令 都 用 简单 指令 来 
模拟 。 


5.7.3 ”流水线 


我 们 已 经 学 过 计算 机 对 于 每 条 指令 使 用 取 指 令 、 译 码 和 执行 三 个 阶段 。 在 早期 计算 机 
中 ， 每 条 指令 的 这 三 个 阶段 需要 串 行 完成 。 换 言 之 ， 指 令 n 需 要 在 指令 n+l 开始 它 的 阶段 
之 前 完成 它 的 所 有 阶段 。 现 代 计 算 机 使 用 称 为 流水 线 的 技术 来 改善 吞吐 量 (在 单位 时 间 内 完 
成 的 指令 总 数 ) 。 这 个 理念 是 如 果 控 制 单元 能 同时 执行 两 个 或 三 个 阶段 ， 那 么 下 一 条 指令 就 
可 以 在 前 一 条 指令 完成 前 开始 。 图 5-24a 显示 了 三 条 连续 的 指令 不 使 用 流水 线 时 是 如 何 处 理 
的 ， 图 5-24b 显示 了 通过 允许 属于 不 同 指令 的 不 同 阶段 的 同时 执行 ， 流 水 线 是 如 何 能 提高 计 
算 机 的 吞吐 量 的 。 换 言 之 ， 当 计算 机 在 执行 第 一 条 指令 的 译 码 阶段 时 ， 它 还 能 执行 第 二 条 指 
令 的 取 指 令 阶段 。 第 一 台 计 算 机 在 指定 时 间 内 平均 执行 9 个 阶段 ， 而 流水 线 计算 机 在 相同 的 
时 间 内 能 执行 24 个 阶段 。 如 果 假 定 每 个 阶段 使 用 相同 的 时 间 ， 那 第 一 台 计 算 机 完成 9/3=3 
条 指令 ， 而 第 二 台 计 算 机 完成 了 24/3=8 条 指令 。 因 此 吞吐 量 提高 了 8/3 或 266%。 





图 5-24 流水线 


当然 ， 流 水 线 并 不 像 这 样 简单 。 像 当 遇 到 转移 指令 时 ， 就 会 出 现 一 些 问题 。 在 这 种 情况 
下 ， 在 管道 中 的 指令 应 该 被 丢弃 。 但 是 ， 新 的 CPU 的 设计 已 经 克服 了 大 部 分 缺点 ， 有 些 新 
的 CPU 设计 甚至 能 同时 进行 多 个 取 指 令 周 期 。 


5.7.4 ”并 行 处 理 


计算 机 传统 上 有 单个 控制 单元 、 单 个 算术 逻辑 单元 、 单 个 内 存单 元 。 随 着 技术 的 进步 和 
计算 机 硬件 成 本 的 下 降 ， 如 今 可 以 拥有 具有 多 个 控制 单元 、 多 个 算术 逻辑 单元 和 多 个 内 存单 
元 的 计算 机 。 这 个 思想 称 为 并 行 处 理 。 像 流水 线 一 样 ， 并 行 处 理 能 改善 吞吐 量 。 

并 行 处 理 涉及 多 种 不 同 的 技术 。 并 行 处 理 的 总 体 视图 是 由 M.J.Flynn 提出 的 分 类 法 给 
出 的 。 这 种 分 类 法 把 计算 机 的 组 织 (从 数据 处 理 来 看 ) 分 成 4 类 ， 正 如 图 5-25 所 示 。 按 照 
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Flynn 的 观点 ， 并 行 处 理 可 能 发 生 在 数据 流 、 指 令 流 或 两 者 都 有 。 

1. SISD 组 织 

单 指令 流 ， 单 数据 流 ( SISD) 组 织 表示 计算 机 
有 一 个 控制 单元 、 一 个 算术 逻辑 单元 和 一 个 内 存单 
元 。 指 令 被 顺序 执行 ， 每 条 指令 可 以 存 取 数 据 流 中 
的 一 个 或 多 个 数据 项 。 本 章 前 面 介绍 的 简单 计算 机 
就 是 SISD 组 织 的 例子 。 图 5-26 显示 了 SISD 组 织 图 5-25 计算 机 组 织 的 分 类 
的 配置 概念 。 


|_sIsp_ |] 单 指令 流 ， 单 数据 流 
|_sMD_] 单 指令 流 ， 多 数据 流 
|_MISD_ 」 多 指令 流 ， 单 数据 流 
|_MMD 多 指令 流 ， 多 数据 流 















a) 概念 b) 配置 
图 5-26 SISD 组 织 


2. SIMD 组 织 
单 指令 流 ， 多 数据 流 ( SIMD) 组 织 表 示 计 算 机 有 一 个 控制 单元 、 多 个 处 理 单元 和 一 个 
内 存单 元 。 所 有 处 理 器 单元 从 控制 单元 接收 相同 的 指令 ， 但 在 不 同 的 数据 项 上 操作 。 同 时 操 
作 于 一 阵列 数据 的 处 理 器 阵列 就 是 属于 这 一 类 的 。 图 5-27 显示 了 SIMD 组 织 的 概念 和 实现 。 
ALU: 算术 逻辑 单元 
单 


CU: 控制 单元 
MU: 内 存单 元 











a) 概念 b) 实现 
图 5-27 SIMD 组 织 


3. MISD 组 织 

多 指令 流 ， 单 数据 流 (MISD) 体系 结构 
是 属于 多 个 指令 流 的 多 个 指令 作用 于 相同 的 
数据 项 的 体系 结构 。 图 5-28 显示 了 这 个 概念 ， 
但 它 从 来 就 未 被 实现 。 

4. MIMD 组 织 

多 指令 流 ， 多 数据 流 (MIMD) 体系 结构 
是 属于 多 个 指令 流 的 多 个 指令 作用 于 多 个 数据 
流 (每 条 指令 作用 于 一 个 数据 项 )。 图 5-29 显 图 5-28 MISD 组 织 


数据 流 
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示 了 概念 和 实现 。 一 些 专家 认为 MIMD 组 织 是 真正 的 并 行 处 理 体系 结构 。 在 这 种 体系 结构 
中 ， 可 以 同时 执行 多 个 任务 。 这 个 体系 结构 可 以 使 用 单个 的 共享 内 存 或 多 个 内 存 区 。 

并 行 处 理 有 多 种 用 途 ， 大 多 用 于 科学 团体 ， 它 们 的 任务 如 果 使 用 传统 的 计算 机 体系 结构 
可 能 需要 几 个 小 时 或 几 天 。 这 些 例子 有 : 大 甜 阵 的 相 乘 、 天 气 预 报 的 大 量 数据 的 同时 处 理 或 
空间 的 飞行 模拟 。 





a) 概念 b) 实现 
图 5-29 MIMD 组 织 


5.8 简单 计算 机 


为 了 解释 计算 机 的 体系 结构 ， 还 有 它们 的 指令 处 理 ， 我 们 引入 一 台 简 单 〈 非 真实 的 ) 计 
算 机 ， 如 图 5-30 所 示 。 简 单 计算 机 有 三 个 组 成 部 分 : CPU、 存 储 器 和 输入 /输出 子 系统 。 


内 容 “地址 
(16 位 ) (8 位 ) 





程序 


数据 


输入 /输出 设备 
5-30 ”简单 计算 机 的 组 成 


5.8.1 CPU 


CPU 本 身 被 分 成 三 部 分 : 数据 寄存 器 、 算 术 逻 辑 单元 (ALU) 和 控制 单元 。 

1. 数据 寄存 器 

计算 机 中 有 16 个 16 位 的 数据 寄存 器 ， 它 们 的 十 六 进 制 地 址 为 (0，1，2，…，F)i， 但 
我 们 称 它 们 为 Re 到 Ris。 在 大 多 数 指令 中 ， 它 们 含有 16 位 数据 ， 但 在 有 些 指令 中 ， 它 们 可 
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能 含有 其 他 信息 。 

2. 控制 单元 

控制 单元 具有 电路 ， 控 制 ALU 的 操作 、 对 内 存 的 存 取 和 对 IO 子 系统 的 存 取 。 它 有 两 
个 专用 的 寄存 器 : 程序 计数 器 和 指令 寄存 器 。 程 序 计 数 器 (PC) (只 含有 8 位 ) 保存 的 是 下 一 
条 将 被 执行 的 指令 的 踪迹 。PC 的 内 容 指向 含有 下 一 条 程序 指令 的 主 存 的 存储 单元 的 地 址 。 
在 每 个 机 器 周期 后 ， 程 序 计 数 器 将 加 1， 指 向 下 一 条 程序 指令 。 指 令 寄存 器 (IR) 含有 16 位 
值 ， 它 是 当前 周期 译 码 的 指令 。 


5.8.2 主 存 


主 存 有 256 个 16 位 的 存储 单元 ,二进制 的 地 址 为 (00000000 到 11111101),, 或 者 是 
十 六 进 制 的 (00 到 FD)ie。 主 存 中 既 有 数据 ， 又 有 程序 指令 。 前 64 个 存储 单元 (00 到 3F)ie 
被 专用 于 程序 指令 。 任 何 程序 的 程序 指令 存储 在 连续 的 内 存单 元 中 ， 内 存单 元 (40 到 FD)ie 
被 用 来 存储 数据 。 


5.8.3 输入 / 输出 子 系统 


简单 计算 机 有 一 个 非常 原始 的 输入 /输出 子 系统 。 子 系统 由 一 个 键盘 和 一 台 监 视 器 组 
成 。 虽 然 在 图 5-30 中 用 分 开 的 盒子 表示 键盘 和 监视 器 ， 但 子 系统 是 内 存 地 址 方式 的 一 部 分 。 
这 些 设备 有 内 存 映射 地 址 ， 正 如 本 章 前 面 讨论 的 。 假 定 键盘 (作为 输入 设备 ) 和 监视 器 (只 
作为 输出 设备 ) 像 内 存单 元 一 样 ， 它 们 的 地 址 分 别 为 (FE)is 和 (FF)is。， 正 如 图 中 所 示 。 换 言 
之 ,假定 它们 就 像 16 位 的 寄存 器 ， 作 为 内 存单 元 与 CPU 进行 交互 。 这 两 个 设备 把 数据 从 外 
界 传输 到 CPU ， 反 之 亦 然 。 


5.8.4 ”指令 集 


简单 计算 机 具有 16 条 指令 集合 的 能 力 ， 虽然 我 们 只 使 用 这 些 指令 中 的 14 条 。 每 条 计 
算 机 指令 由 两 部 分 构成 : 操作 码 (opcode) 和 操作 数 ( operand)。 操 作 码 指明 了 在 操作 数 上 
执行 的 操作 的 类 型 。 每 条 指令 由 16 位 组 成 ， 被 分 成 4 个 4 位 的 域 。 最 左边 的 域 含 有 操作 码 ， 
其 他 3 个 域 含 有 操作 数 或 操作 数 的 地 址 ， 如 图 5-31 所 示 。 


操作 码 操作 数 





TTTTIITIITTITT| 
ee 
4 位 12 位 
a) 指令 格式 
操作 码 入 内存 地 址 | R- 地 址 | 
ER- 地 址 | R- 地 址 层 3 R- 地 址 | 内存 地 址 | 
操作 码 ER- 地 址 | nw | 0 或 1 | 
b) 指令 类 型 


图 5-31 格式 和 不 同 指令 类 型 


指令 列 在 表 5-4 中 。 注 意 ， 并 不 是 每 条 指令 都 需要 3 个 操作 数 。 任 何不 需要 的 操作 数 域 
被 填 以 (0)ie。 例 如 ， 停 机 指令 的 所 有 3 个 操作 数 域 、 传 送 指令 和 NOT 指令 的 最 后 一 个 域 都 
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被 填 以 (0)s。 还 要 注意 ， 寄 存 器 地 址 是 用 单个 十 六 进 制 数 来 表示 的 ， 所 以 只 用 一 个 域 ， 而 内 
存单 元 是 用 两 个 十 六 进 制 数 来 表示 ， 所 以 用 两 个 域 。 


表 5-4 简单 计算 机 的 指令 表 


| 
| | 停止 程序 的 执行 
| | 
| 


Rp < Ms 
Mp Rs 


Wi 

| Ry | Re | Ro RutRe 
| | 
| | 
OR WE 和 | RS1 Rs2 Rp 二 Rs OR Rs 

me | “| * | | lea 

ROTATE i 0 或 1 Rot 及 


关键 : Rs、Rs!、Rsz: 源 寄存 器 的 十 六 进 制 地 址 
Rp: 目的 寄存 器 的 十 六 进 制 地 址 

Ms: 源 内 存单 元 的 十 六 进 制 地 址 

Mp: 目的 内 存单 元 的 十 六 进 制 地 址 

n: 十 六 进 制 数 

di、 qd、 ds;、 da: 第 一 、 en 四 个 十 六 进 制 数 


加 法 指令 有 两 条 : 一 条 用 作 整 数 的 相 加 (ADDI),， 一 条 用 作 浮 点 数 的 相 加 (ADDF)。 如 
果 使 用 地 址 (EE)i 作为 LOAD 指令 的 第 二 个 操作 数 ， 简 单 计 算 机 就 可 以 从 键盘 取得 输入 。 
同样 ， 如 果 使 用 地 址 (FF)is 作为 STORE 指令 的 第 二 个 操作 数 ， 计 算 机 就 可 以 发 送 输出 到 监 
视 器 。 如 果 ROTATE 指令 的 第 三 个 操作 数 是 0， 那么 指令 就 把 R 中 的 二 进 制 位 模式 向 右 循 
环 移 位 nn 个 位 置 ， 如 果 第 三 个 操作 数 是 1， 则 向 左 循环 移 位 。 此 外 还 有 加 1 (INC) 和 减 1 
(DEC) 指令 。 


5.8.5 ”处 理 指令 


像 大 多 数 计 算 机 一 样 ， 简 单 计 算 机 使 用 机 器 周期 。 一 个 周期 有 三 个 阶段 : 取 指 令 、 译 
码 和 执行 。 在 取 指 令 阶段 ， 其 地 址 由 PC 决定 的 指令 从 内 存 中 得 到 ， 被 装 入 IR 中 。 然 后 PC 
加 1， 指 向 下 一 条 指令 。 在 译 码 阶段 ，IR 中 的 指令 被 译 码 ， 所 需 的 操作 数 从 寄存 器 或 内 存 
中 取 到 。 在 执行 阶段 ， 指 令 被 执行 ， 结 果 被 放 人 合适 的 内 存单 元 或 寄存 器 中 。 一 旦 第 三 阶段 
结束 ， 控 制 单元 又 开始 新 的 周期 ， 现 在 PC 是 指向 下 一 条 指令 的 。 处 理 过 程 一 直 继 续 ， 直 到 
CPU 遇 到 HALT 指令 。 
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一 个 例子 

让 我 们 显示 简单 计算 机 如 何 进 行 整 数 A 和 B 的 相 加 的 ,创建 的 结果 为 C。 假 定 整数 是 
二 进 制 补 码 格式 。 在 数学 上 ， 这 个 操作 表示 为 : 

C=A+B 

为 了 用 简单 计算 机 解决 这 个 问题 ， 有 必要 把 前 面 两 个 整数 存放 在 寄存 器 中 (例如 Re 和 
Ri )。 操 作 的 结果 存放 在 第 三 个 寄存 器 中 (例如 Rs)。ALU 只 能 操作 那些 存储 在 CPU 数据 
寄存 器 中 的 数据 。 但 是 ， 大 多 数 计算 机 (包括 简单 的 计算 机 ) 在 CPU 中 只 有 有 限 的 寄存 器 。 
如 果 数 据 项 的 数量 很 大 ， 并 且 它 们 在 程序 执行 过 程 中 应 该 保留 在 计算 机 中 ， 比 较 好 的 方法 是 
把 它们 存储 在 内 存 中 ， 临 时 地 把 它们 调 人 寄存 器 中 。 这 样 我 们 假定 前 两 个 整数 存储 在 内 存 
单元 (40)is 和 (41)i6o 结果 应 该 被 存储 在 内 存单 元 (42)i6 中 。 这 就 意味 着 两 个 整数 需要 被 调 
入 CPU 中 ， 结 果 需 要 被 存储 在 内 存 中 。 因 此 ， 完 成 这 个 简单 加 法 的 简单 程序 需要 5 条 指令 ， 
显示 如 下 

1 ) 把 内 存 Ma 的 内 容 装 人 寄存 器 Re (Ro 二 Ms ) 。 

2 ) 把 内 存 M4i 的 内 容 装 人 寄存 器 Ri (Ri 一 M4 )。 

3 ) 相 加 Re 和 Ri 的 内 容 ， 结 果 放 入 Rs 中 (Rs 一 Ro+ Ri )。 

4) 把 Rz 的 内 容 存 人 Me 中 (Me < RR; )。 

5 ) 停机 。 

在 简单 计算 机 的 语言 中 ， 这 5 条 指令 被 译 码 为 : 


代 码 


解 


5.8.6 ”存储 程序 和 数据 


为 了 遵循 冯 : 诺 依 曼 模型 ， 我 们 需要 把 程序 和 数据 存储 在 内 存 中 ， 可 以 从 内 存单 元 
(00)i6 到 (04)ie 存储 5 行程 序 。 我 们 已 经 知道 数据 也 需要 被 存储 在 内 存单 元 (40)ik、(41)ik 和 
(42)16 中 。 


5.8.7 ”指令 周期 ~ 


计算 机 每 条 指令 使 用 一 个 指令 周期 。 如 果 有 5 条 指令 的 小 程序 ， 那 么 需要 5 个 指令 周期 。 
每 个 周期 通常 由 三 个 步骤 组 成 : 取 指 令 、 译 码 、 执 行 。 现 在 假定 需要 相 加 161+254=415。 
这 些 数据 在 内 存 中 用 十 六 进 制 表示 为 : (00A1)is。、(00FE)is。 和 (019F)i6。 

1. 周期 1 

在 第 一 周期 开始 时 (图 5-32 )，PC 指向 程序 的 第 一 条 指令 ， 它 在 内 存单 元 (00)is 中 。 控 
制 单元 经 历 如 下 三 个 步骤 : 

1 ) 控制 单元 取出 存储 在 内 存单 元 (00)is 中 的 指令 ， 放 和 IR 中 ，PC 的 值 加 1; 

2 ) 控制 单元 译 码 指令 (1040)i6 为 Ro 二 Mao; 


释 
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3 ) 控制 单元 执行 指令 ， 这 意味 着 存储 在 内 存单 元 (40)i 中 的 整数 的 副本 被 装 人 寄存 器 
Ro 中 。 























控制 单元 ; 41 






O 取 指令 @ 译 码 
@ 执行 


Q040), 的 译 码 


图 5-32 周期 1 的 状态 


2. 周期 2 

在 第 二 周期 开始 时 (图 5-33 )，PC 指向 程序 的 第 二 条 指令 ， 它 在 内 存单 元 (01)ie 中 。 控 
制 单元 经 历 如 下 三 个 步骤: 

1 ) 控制 单元 取出 存储 内 存单 元 (01)i 中 的 指令 ， 放 人 IR 中 ，PC 的 值 加 1; 

2 ) 控制 单元 译 码 指令 (1141)i6 为 Ri 二 M4l; 

3 ) 控制 单元 执行 指令 ， 这 意味 着 存储 在 内 存单 元 (1141)i 中 的 整数 的 副本 被 装 人 寄存 
器 Ri 中 。 


PC [IN 
1141 


控制 单元 





@@ 评 码 G141), 的 译 码 


@ 执行 
图 5-33 周期 2 的 状态 
3. 周期 3 


在 第 三 周期 开始 时 (图 5-34 )，PC 指向 程序 的 第 三 条 指令 ， 它 在 内 存单 元 (02)16 中 。 控 
制 单元 经 历 如 下 三 个 步骤 ; 
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1 ) 控制 单元 取出 存储 内 存单 元 (02)16 中 的 指令 ， 放 入 IR 中 ，PC 的 值 加 1; 

2 ) 控制 单元 译 码 指令 (3201)i6 为 R 一 Ro+ Ri; 

3 ) 控制 单元 执行 指令 ， 这 意味 着 寄存 器 Ro 的 内 容 被 加 到 寄存 器 Ri 的 内 容 上 (由 ALU 
完成 )， 结 果 放 在 R 中 。 





@ G20D, 的 评 码 
@ 执行 


图 5-34 周期 3 的 状态 


4. 周期 4 

在 第 四 周期 开始 时 (图 5-35 )，PC 指向 程序 的 第 四 条 指令 ， 它 在 内 存单 元 (03)ie 中 。 控 
制 单元 经 历 如 下 三 个 步骤 : 

1 ) 控制 单元 取出 存储 内 存单 元 (03)is 中 的 指令 ， 放 人 IR 中 ，PC 的 值 加 1; 

2 ) 控制 单元 译 码 指令 (2422)i6 为 Ma 二 Ry; 

3 ) 控制 单元 执行 指令 ， 这 意味 着 寄存 器 R; 中 整数 的 副本 被 存储 到 内 存单 元 (42)i6 中 。 


控制 单元 


2 





@ 译 码 (2422),。 的 译 码 


@@ 执行 
图 5-35 周期 4 的 状态 
5. 周期 5 
在 第 五 周期 开始 时 (图 5-36 )，PC 指向 程序 的 第 五 条 指令 ， 它 在 内 存单 元 (04)i 中 。 控 
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制 单元 经 历 如 下 三 个 步骤 : 
1 ) 控制 单元 取出 存储 内 存单 元 (04)ik 中 的 指令 ， 放 入 IR 中 ，PC 的 值 加 1; 
2 ) 控制 单元 译 码 指令 (0000)i 为 Halt; 
3 ) 控制 单元 执行 指令 ， 这 意味 着 计算 机 停止 。 


控制 单元 





存储 器 
O 取 指令 
Oi (0000) 的 译 码 
图 5-36 周期 5 的 状态 
5.8.8” 另 一 个 例子 


在 前 面 的 例子 中 ， 我 们 假定 要 相 加 的 两 个 整数 已 经 在 内 存 中 ， 还 假定 相 加 的 结果 将 保存 
在 内 存 中 。 你 可 能 会 问 如 何 能 把 两 个 要 相 加 的 整数 存 到 内 存 中 ， 或 当 结果 被 存储 在 内 存 中 ， 
如 何 使 用 这 结果 。 在 真实 情况 中 ， 我们 使 用 像 键盘 这 样 的 输入 设备 输入 前 两 个 整数 到 内 存 
中 ， 通 过 像 监视 器 这 样 的 输出 设备 显示 第 三 个 整数 。 通 过 输入 设备 获得 数据 通常 被 称 为 读 操 
作 ; 而 向 输出 设备 发 送 数 据 通 常 被 称 为 写 操作 。 为 了 使 我 们 前 面 的 程序 更 实用 ， 需 要 将 其 修 
改 如 下 : 

1 ) 读 整 数 ， 存 人 Mao。 

2 ) Ro Moo 

3 ) 读 整 数 ， 存 人 Mi。 

4) Ri Maio 

5) R; + Rot Rio 

6 ) M4 *— R2o 

7 ) 根据 Ms 的 内 容 写 出 整数 。 

8 ) 停机 。 

有 许多 方法 来 实现 输入 和 输出 。 如 今 大 多 数 计算 机 进行 从 输入 设备 到 内 存 的 直接 数据 传 
输 和 从 内 存 到 输出 设备 的 直接 数据 传输 。 但 是 ， 简 单 计 算 机 不 是 它们 中 的 一 个 。 在 计算 机 中 ， 
可 以 使 用 LOAD 和 STORE 指令 模拟 读 和 写 操作 ， 而 且 LOAD 和 STORE 读数 据 输入 到 CPU 
和 从 CPU 中 写 数据 。 我 们 需要 两 条 指令 来 读数 据 进入 内 存 和 从 内 存 写 出 数据 。 读 操作 为 : 

R 二 Mrs 因为 键盘 被 假定 为 内 存单 元 (FE)'e 

MR . 
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写 操作 为 : 

R 一 M 

Mr 一 RR ”因为 监视 器 被 假定 为 内 存单 元 (FF)16 

你 可 能 会 问 ， 如 果 操 作 是 应 该 在 CPU 中 完成 的 ， 那 么 我 们 为 什么 把 数据 从 键盘 传输 到 
CPU， 然 后 再 到 内 存 ， 然 后 再 到 CPU 进行 处 理 ? 我 们 能 直接 传输 数据 到 CPU 吗 ? 答案 是 对 
这 个 小 问题 我 们 能 这 样 做 ,但 在 原则 上 不 应 该 这 样 做 。 考 虑 一 下 ， 如 果 需 Cs 
或 者 对 1 000 000 个 整数 进行 排序 ，CPU 中 的 寄存 器 数目 是 有 限 的 (在 真实 的 计算 机 中 ， 
可 能 是 几 百 个 , 但 仍然 是 不 够 的 )。 





考虑 到 这 些 ， 程 序 被 编写 成 : 





Er | | 
操作 1 到 4 是 输入 ,操作 9 和 10 是 输出 。 当 我 们 运行 这 个 程序 时 ， 它 等 待 用 户 从 键盘 
输入 两 个 整数 和 按 回 车 键 。 然 后 程序 计算 和 ， 结 果 显 示 在 监视 器 上 。 


5.8.9 可 重用 性 


与 不 可 编程 的 计算 器 相 比 ， 计 算 机 的 一 个 优点 是 我 们 能 反复 使 用 相同 的 程序 。 我 们 能 运 
行程 序 多 次 ， 每 次 键 人 不 同 的 输入 ， 得 到 不 同 的 输出 。 


5.9 ” 章 末 材料 
推荐 读物 


有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 

©® Englander, I. The Architecture of Computer Hardware and System Software, Hoboken, 
NJ: Wiley, 2003 

@ Mano, M. Computer System Architecture, Upper Saddle River, NJ: eR Hall, 1993 

e Null,L. and Lobur, J. Computer Organization and Architecture, Sudbury, MA: Jones 
and Bartlett, 2003 

® Hamacher, C., Vranesic, Z. and Zaky, S. Computer Organization, New York: McGraw- 
Hill, 2002 

@ Warford,S. Computer systems, Sudbury, MA: Jones and Bartlett, 2005 

@ Ercegovac, M., Lang, T. and Moreno, J. Introduction to Digital Systems, Hoboken, NJ: 
Wiley, 1998 

® Cragon, H. Computer Architecture and Implementation, Cambridge: Cambridge 
University Press, 2000 

® Stallings, W. Computer Organization and Architecture, Upper Saddle River, NJ: Prentice 
Hall, 2002 
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小 结 





计算 机 的 组 成 分 成 三 大 类 (或 子 系统 ): CPU、 主 存 和 输入 /输出 子 系统 。 


e 中 央 处 理 单元 (CPU) 执行 数据 上 的 操作 ， 它 有 三 部 分 : 算术 逻辑 单元 (ALU)、 控 制 


5.10 


小 测验 


单元 和 一 系列 寄存 器 。 算 术 逻 辑 单元 (ALU) 负责 算术 、 移 位 和 逻辑 运算 。 寄 存 器 是 
快速 独立 的 存储 设备 ， 它 可 暂时 地 保留 数据 。 控 制 单元 控制 CPU 中 每 个 部 分 的 操作 。 
主 存 是 存储 单元 的 集合 。 每 一 个 单元 有 一 个 称 为 地 址 的 标识 符 。 数 据 被 传输 到 内 存 
或 从 内 存 取 出 是 以 称 为 字 的 二 进 制 位 组 的 方式 。 内 存 中 唯一 可 标识 的 单元 总 数 称 为 
地 址 空间 。 有 两 种 内 存 可 用 : 随机 存 取 存储 器 (RAM) 和 只 读 存储 器 (ROM) 。 
输入 /输出 (IO) 子 系统 的 设备 集合 允许 计算 机 与 外 界 通信 ， 存 储 程序 和 数据 ， 即 
使 在 计算 机 已 关机 时 也 可 以 。 输 入 /输出 设备 分 成 两 大 类 : 非 存储 设备 和 存储 设备 。 
非 存储 设备 允许 CPU/ 内 存 与 外 界 通信 ; 存储 设备 可 以 存储 以 后 被 检索 的 大 量 信息 。 
存储 设备 被 分 成 磁 的 和 光 的 。 

计算 机 中 三 个 子 系统 的 连接 起 重要 的 作用 ， 因 为 在 这 些 子 系统 间 和 需要 进行 信息 的 通 
信 。CPU 和 内 存 通 常 被 三 个 连接 连 在 一 起 (每 个 称 为 总 线 ) : 数据 总 线 、 地 址 总 线 和 
控制 总 线 。 输 入 /输出 设备 通过 输入 / 输出 控制 器 或 接口 与 总 线 相连 ,使 用 的 控制 器 
有 多 种 ， 如 今 最 常见 的 有 : SCSI、 火 线 和 USB。 

有 两 种 输入 /输出 设备 的 寻 址 方法 : IO 独立 寻 址 和 1/O 存储 器 映射 寻 址 。 在 IO 独 
立 寻 址 方法 中 ， 用 来 从 (或 到 ) 内 存 读 / 写 的 指令 完全 不 同 于 用 来 从 (或 到 ) 输入 / 
输出 设备 的 读 / 写 指令 。 在 IO 存储 器 映射 寻 址 方法 中 ，CPU 把 IO 控制 器 中 的 每 个 
寄存 器 看 成 是 内 存 中 的 一 个 字 。 

如 今 ， 通 用 计算 机 使 用 称 为 程序 的 一 组 指令 来 处 理 数 据 。 计 算 机 执行 程序 ， 从 输入 
数据 创建 输出 数据 。 程 序 和 数据 都 存储 在 内 存 中 。CPU 使 用 重复 的 机 器 周期 一 条 接 
一 条 ， 从 头 到 尾 执行 程序 中 的 指令 。 简 化 的 周期 由 三 阶段 组 成 : 取 指 令 、 译 码 和 执行 。 
有 三 种 使 CPU 和 输入 /输出 设备 同步 的 方法 : 程序 控制 输入 /输出 、 中 断 控制 输入 / 
输出 和 直接 存储 器 存 取 (DMA )。 

在 最 近 的 几 十 年 中 ， 计 算 机 的 体系 结构 和 组 织 经 历 了 许多 变化 。 计 算 机 体系 结构 分 
成 两 大 类 : CISC (复杂 指令 集 计 算 机 ) 和 RISC (精简 指令 集 计算 机 )。 

现代 计算 机 使 用 流水 线 技术 提高 吞吐 量 。 这 个 理念 允许 控制 单元 同时 执行 两 个 或 三 
个 阶段 ， 这 意味 着 下 一 条 指令 的 处 理 可 以 在 前 一 条 结束 前 开始 。 

计算 机 传统 上 有 一 个 控制 单元 、 一 个 算术 逻辑 单元 和 一 个 内 存单 元 。 并 行 处 理 通过 
使 用 多 指令 流 处 理 多 数据 流 来 改善 吞吐 量 。 


练习 


在 本 书 网 站 上 提供 一 套 与 本 章 相 关 的 交互 式 测验 题 。 强 烈 建议 学 生 在 继续 本 章 习 题 前 首 
先 完成 相关 测验 题 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 计算 机 由 哪 三 个 子 系统 组 成 ? 
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2. CPU 由 哪 几 个 部 分 组 成 ? 

3. ALU 的 功能 是 什么 ? 

4. 控制 单元 的 功能 是 什么 ? 

5. 主 存 的 功能 是 什么 ? 

6. 定义 RAM、ROM、SRAM、DRAM、PROM、EPROM 和 EEPROM。 
7. 高 速 缓冲 存储 器 的 作用 是 什么 ? 

8. 描述 一 下 磁盘 的 物理 组 成 。 

9. 磁盘 和 磁带 表面 是 怎样 组 织 的 ? 

10. 比较 分 析 CD-R、CD-RW 和 DVD。 

11. 比较 分 析 SCSI、 火 线 和 USB 控制 器 。 

12. 比较 分 析 两 种 IO 设备 寻 址 的 方法 。 

13. 比较 分 析 三 种 同步 CPU 和 IO 设备 的 方法 。 
14. 比较 分 析 CISC 体系 结构 和 RISC 体系 结构 。 
15. 描述 流水 线 及 其 作用 。 

16. 描述 并 行 处 理 及 其 作用 。 


练习 题 
.一 台 计算 机 有 64 MB ( 浪 字 节 ) 的 内 存 ， 每 个 字 长 为 4 字 节 。 那 么 在 存储 器 中 对 每 个 字 寻 址 需要 多 


少 位 ? 
2. 如 果 屏 幕 有 24 行 ， 每 行 80 个 字符 ， 则 需要 多 少 字 节 的 内 存 用 于 存储 全 屏 的 数据 ? 如果 系统 使 用 
ASCII 码 ， 每 个 ASCII 字符 占 1 字 节 。 
3. 假如 一 台 计 算 机 有 16 个 数据 寄存 器 (R0 一 R15 )，1024 个 字 的 存储 空间 以 及 16 种 不 同 的 指令 (如 
add、subtract 等 )， 那 么 下 面 这 条 指令 最 少 需要 占 多 少 位 空间 ? 
add M R2 
4. 在 第 3 题 中 ， 如 果 数 据 和 指令 使 用 相同 的 字 长 ， 那 么 每 个 数据 寄存 器 大 小 是 多 少 ? 
5. 在 第 3 题 中 ,计算 机 中 的 指令 寄存 器 大 小 是 多 少 ? 
6. 在 第 3 题 中 ,计算 机 中 的 程序 计数 器 大 小 是 多 少 ? 
7. 在 第 3 题 中 ， 数 据 总 线 为 多 少 位 ? 
8. 在 第 3 题 中 ， 地 址 总 线 为 多 少 位 ? 
9. 在 第 3 题 中 ， 控 制 总 线 最 少 需要 多 少 位 ? 
10. 计算 机 使 用 IO 独立 寻 址 。 内 存 为 1024 个 字 。 如 果 每 个 控制 器 包括 16 个 寄存 器 ， 那 么 计算 机 可 以 
存 取 多 少 个 控制 器 ? 
11. 计算 机 使 用 IO 存储 器 映射 寻 址 。 地 址 总 线 为 10 条 (10 位 )。 如 果 内 存 为 1000 个 字 ， 那么 计算 机 
可 以 存 取 多 少 个 四 位 寄存 器 控制 器 ? 
12. 使 用 5.8 节 中 的 简单 计算 机 指令 集 ， 编 写 执行 下 列 计算 的 程序 代码 : 
D * 一 A+B+C 
A、B、C 和 D 是 二 进 制 补 码 格式 的 整数 ， 用 户 输入 A、B 和 C 的 值 , D 的 值 显示 在 监视 器 上 。 
13. 使 用 5.8 节 中 的 简单 计算 机 指令 集 ， 编 写 执行 下 列 计算 的 程序 代码 : 
B 一 A+3 
A 和 3 是 二 进 制 补 码 格式 的 整数 ， 用 户 输入 A 的 值 , B 的 值 显 示 在 监视 器 上 。( 提 示 : 使 用 加 1 指令 )。 
14. 使 用 5.8 节 中 的 简单 计算 机 指令 集 ， 编 写 执行 下 列 计算 的 程序 代码 : 
B * 一 A-2 
A 和 2 是 二 进 制 补 码 格式 的 整数 ， 用 户 输入 A 的 值 , B 的 值 显示 在 监视 器 上 。( 提 示 : 使 用 减 1 指令 )。 
15. 使 用 5.8 节 中 的 简单 计算 机 指令 集 ， 为 程序 编写 代码 ， 该 程序 完成 n 个 从 键盘 输入 的 整数 的 相 加 ， 
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并 显示 它们 的 和 。 你 首先 需要 输入 的 值 。( 提 示 : 使 用 减 1 指令 和 跳 转 指令 ,重复 n 次 加 运算 )。 

16. 使 用 5.8 节 中 的 简单 计算 机 指令 集 ， 为 程序 编写 代码 ， 该 程序 接收 从 键盘 来 的 两 个 整数 ， 如 果 第 一 
个 整数 为 0， 程序 把 第 二 个 整数 加 1; 如 果 第 一 个 整数 是 1， 程 序 把 第 二 个 整数 减 1。 第 一 个 整数 必 
须 是 0 或 1， 否则 程序 失败 。 程 序 显 示 加 1 或 减 1 的 结果 。 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通 过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨 论 材料 的 理解 。 


| 第 6 章 


Foundations of Computer Science, Third Edition 


计算 机 网 络 和 因特网 





个 人 计算 机 的 发 展 带动 了 商业 、 工 业 、 科 学 和 教育 的 巨大 改变 。 网 络 也 发 生 了 类 似 的 变 
革 。 技 术 的 进步 使 得 通信 线路 能 传送 更 多 、 更 快 的 信号 。 而 不 断 发 展 的 服务 使 得 我 们 能 够 使 
用 这 些 扩展 的 能 力 。 计 算 机 网 络 领 域 的 研究 导致 了 新 技术 的 产生 一 一 在 全 球 各 个 地 方 交换 文 
本 、 音 频 和 视频 等 数据 ， 在 任何 时 候 快速 、 准 确 地 下 载 或 上 载 信 息 。 
目标 
通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 
描述 局 域 网 和 广域网 (LAN 和 WAN); 
区 分 因特网 与 互联 网 ; 
描述 作为 因特网 网 络 模 型 的 TCP/IP 协议 族 ; 
定义 TCP/IP 协议 族 中 的 各 层 以 及 它们 的 关系 ; 
从 应 用 层面 描述 一 些 应 用 ; 
描述 传输 层 协 议 提 供 的 服务 ; 
描述 网 络 层 协议 提供 的 服务 ; 
描述 数据 链 路 层 使 用 的 不 同 协议 ; 
描述 物理 层 的 责任 ; 
描述 在 计算 机 网 络 中 使 用 的 不 同 传输 媒介 。 


6.1 引言 


虽然 本 章 的 目标 是 讨论 因特网 ， 一 个 将 世界 上 几 十 亿 台 计算 机 互相 连接 的 系统 , 我们 对 
因特网 的 认识 不 应 该 是 一 个 单独 的 网 络 ， 而 是 一 个 网 络 结 合体 ， 一 个 互联 网 络 。 因 此 ， 我 们 
的 旅程 将 从 定义 一 个 网 络 开 始 。 然 后 我 们 将 要 展示 如 何 通 过 网 络 连接 来 建造 小 型 的 互联 网 
络 。 最 终 我 们 会 展示 因特网 的 结构 并 且 在 本 章 的 余下 部 分 开启 研究 因特网 的 大 门 。 


6.1.1 网 络 


网 络 是 一 系列 可 用 于 通信 的 设备 相互 连接 构成 的 。 在 这 个 定义 里 面 ， 一 个 设备 可 以 是 
一 台 主 机 (或 用 另 一 种 称呼 ， 端 系统 )， 比 如 一 台大 型 计算 机 、 台 式 机 、 便 携 式 计算 机 、 工 
作 站 、 手 机 或 安全 系统 。 在 这 种 定义 中 ， 设 备 也 可 以 是 一 个 连接 设备 ， 比 如 用 来 将 一 个 网 络 
与 另 一 个 网 络 相 连接 的 路 由 器 ， 一 个 将 不 同 设备 连接 在 一 起 的 交换 机 ， 或 者 一 个 用 于 改变 数 
据 形式 的 调制 解 调 器 ， 等 等 。 在 一 个 网 络 中 ， 这 些 设 备 都 通过 有 线 或 无 线 传输 媒介 (比如 电 
缆 或 无 线 信 号 ) 互相 连接 。 当 我 们 在 家 通过 即 插 即 用 路 由 器 连接 两 台 计 算 机 时 ， 虽 然 规模 很 
小 ， 但 已 经 建造 了 一 个 网 络 。 

1. 局 域 网 

局 域 网 (LAN) 通常 是 与 单个 办 公 室 、 建 筑 或 校园 内 的 几 个 主机 相连 的 私有 网 络 。 基 于 
机 构 的 需求 ， 一 个 局 域 网 既 可 以 简单 到 某 人 家 庭 办 公 室 中 的 两 台 个 人 计算 机 和 一 台 打 印 机 ， 
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也 可 以 扩大 至 一 个 公司 范围 ， 并 包括 音频 和 视频 设备 。 在 一 个 局 域 网 中 的 每 一 台 主 机 都 有 作 
为 这 台 主 机 在 局 域 网 中 唯一 定义 的 一 个 标识 符 和 一 主机 1 ”主机 2 ”主机 3 ”主机 4 
个 地 址 。 一 台 主 机 向 男 一 台 主 机 发 送 的 数据 包 中 包 | cD 
括 源 主机 和 目标 主机 的 地 址 。 图 6-1 展示 了 局 域 网 | C» CC> WW 
的 一 个 例子 。 

2. 广 域 网 





广域网 (WAN) 也 是 通信 设备 互 连 构成 的 。 但 > > > 
是 广域网 与 局 域 网 之 间 有 一 些 差别 。 局 域 网 的 大 小 主机 5 主机 6 主机 7 主机 8 
通常 是 受 限 制 的， 跨越 一 个 办 公 室 、 一 座 大 楼 或 图 6-1 局 域 网 的 一 个 例子 


一 个 校园 ; 而 广域网 的 地 理 跨 度 更 大 ， 可 以 横 跨 一 个 城镇 、 一 个 州 、 一 个 国家 ， 甚 至 横 跨 世 
界 。 局 域 网 将 主机 互 连 ， 广域网 则 将 交换 机 、 路 由 器 或 调制 解 调 器 之 类 的 连接 设备 互 连 。 通 
常 ， 局域网 为 机 构 私 有 ， 广 域 网 则 由 通信 公司 创建 并 运营 ， 并 且 租 给 使 用 它 的 机 构 。 我 们 可 
以 看 到 广域网 的 两 种 截然 不 同 的 案例 : 点 对 点 广域网 和 交换 广域网 ， 如 图 6-2 所 示 。 

点 对 点 广域网 是 通过 传输 媒介 (电缆 或 无 线 ) 连接 两 个 通信 设备 的 网 络 。 图 6-2 展示 了 
点 对 点 广域网 的 一 个 例子 。 
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b) 交换 广域网 


图 6-2 点 对 点 广域网 和 交换 广域网 


交换 广域网 是 一 个 有 至 少 两 个 端的 网 络 。 就 像 我 们 很 快 就 会 看 到 的 那样 ， 交 换 广域网 用 
于 当今 全 球 通信 的 骨干 网 。 我 们 也 可 以 这 么 说 ， 交 换 广域网 是 几 个 点 对 点 广域网 通过 开关 连 
接 产生 的 结合 体 。 

3. 互联 网络 

现在 很 难看 见 独立 存在 的 局 域 网 或 广域网 ， 它 们 现在 都 是 互相 连接 的 。 当 两 个 或 多 个 网 
络 互相 连接 时 ， 它 们 构成 一 个 互联 网 络 ， 或 者 说 网 际 网 。 举 一 个 例子 ， 假 设 一 个 机 构 有 两 个 
办 公 室 ,并 且 两 个 办 公 室 都 通过 局 域 网 来 进行 办 公 室内 所 有 雇员 之 间 的 通信 ， 那么 为 了 使 不 
同 办 公 室 的 雇员 之 间 的 通信 成 为 可 能 ， 管 理 部 门 从 电话 公司 之 类 的 服务 供应 商 那里 租用 了 一 
个 无 需 拨 号 的 点 对 点 广域网 并 且 将 两 个 局 域 网 相连 。 现 在 这 个 公司 就 拥有 了 一 个 互联 网 络 ， 
或 者 说 一 个 私人 网 际 网 ， 不 同 办 公 室 之 间 的 通信 也 可 以 实现 了 。 图 6-3 展示 了 这 个 互联 网 络 。 


6.1.2 因特网 
正如 我 们 之 前 讨论 过 的 ， 一 个 网 际 网 是 两 个 或 多 个 可 以 互相 通信 的 网 络 。 最 值得 注意 
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的 网 际 网 是 因特网 ， 它 由 成 千 上 万 个 互 连 的 网 络 组 成 。 图 6-4 展示 了 因特网 的 一 个 概念 图 像 
(而 非 地 理 图 像 )。 


I 用 户 
交换 广 域 Ce 
Ep 
的 点 对 点 广域网 
路 由 器 
路 由 器 3 





图 6-3 一 个 由 4 个 局 域 网 和 3 个 广域网 构成 的 互联 网 络 


这 幅 图 将 因特网 展示 为 几 个 骨干 网 、 供 应 商 网 络 和 客户 网 络 。 在 顶层 ， 骨 干 网 为 通信 公 
司 所 拥有 ， 这 些 骨 干 网 通过 一 些 复杂 的 交换 系统 相互 连接 。 我 们 把 这 些 交 换 系 统称 为 网 络 对 
等 交汇 点 ( peering point)。 在 第 二 层 ， 有 一 些 规 模 较 小 的 网 络 ， 这 些 网 络 称 为 供应 商 网 络 ， 
它们 付费 使 用 骨干 网 上 的 一 些 服 务 。 这 些 供应 商 网 络 与 骨干 网 相连 接 ， 有 时 也 连接 其 他 供应 
商 网 络 。 在 因特网 的 边缘 有 一 些 真正 使 用 基于 因特网 的 服务 的 网 络 ， 这 些 网 络 是 客户 网 络 ， 
他 们 向 供应 商 网 络 付费 来 得 到 服务 。 

上 骨干 网 和 供应 商 网 络 也 被 称 为 因特网 服务 供应 商 (ISP)， 上 骨干 网 通常 被 称 为 国际 因特网 
服务 供应 商 ， 供 应 商 网 络 则 被 称 为 国内 或 地 域 性 因特网 服务 供应 商 。 


客户 网 络 》。。。 人 客户 网 络 客户 网 络 》。。。 人 客户 网 络 


供应 商 网 络 ee。 供应 商 网 络 


// 


交汇 点 最、 | zi 网 络 对 等 










供应 商 网 络 供应 商 网 络 供应 商 网 络 
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图 6-4 当今 的 因特网 
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6.1.3 ”硬件 和 软件 


我 们 已 经 展示 了 因特网 通过 连接 设备 将 大 大 小 小 的 网 络 互相 交织 在 一 起 构成 的 基本 结 
构 。 然 而 ， 如 果 仅 仅 将 这 些 部 分 连接 在 一 起 ， 很 明显 什么 都 不 会 发 生 。 为 了 产生 沟通 ， 既 需 
要 硬件 也 需要 软件 设备 。 这 就 像 当 进 行 一 个 复杂 的 计算 时 ， 我们 同时 需要 计算 机 和 程序 。 下 
一 节 将 展现 这 些 硬件 和 软件 的 组 合 是 如 何 通过 协议 分 层 来 互相 配合 的 。 


6.1.4 协议 分 层 


当 谈 论 因特网 时 ， 有 一 个 词 我 们 总 是 会 听见 ， 这 个 词 就 是 协议 。 协 议定 义 了 发 送 器 、 接 
收 器 以 及 所 有 中 间 设 备 必须 遵守 以 保证 有 效 地 通信 的 规则 。 简 单 的 通信 可 能 只 需要 一 条 简单 
的 协议 ， 当 通信 变 得 复杂 时 ， 可 能 需要 将 任务 分 配 到 不 同 的 协议 层 中 ， 在 这 种 情况 下 ， 我 们 
在 每 一 个 协议 层 都 需要 一 个 协议 ， 或 者 协议 分 层 。 

1. 情景 

为 了 更 好 地 理解 协议 分 层 的 必要 ， 首 先 我 们 开发 一 个 简单 的 场景 。 假 定 Ann 和 Maria 
是 有 很 多 共同 想法 的 邻居 ， 她 们 每 次 都 会 为 了 一 个 何 时 退休 的 计划 互相 见面 和 进行 沟通 。 突 
然 ，Ann 所 在 的 公司 为 她 提供 了 一 个 升 职 的 机 会 ， 但 是 同时 要 求 她 搬 到 在 离 Maria 很 远 的 一 
个 城市 中 的 分 部 去 住 。 由 于 她 们 想 出 了 一 个 具有 创新 性 的 计划 一 一 在 退休 后 开始 做 新 的 生 
意 ， 这 两 个 朋友 仍然 想 继续 她 们 的 通信 并 且 就 这 个 新 计划 交换 想法 。 她 们 决定 通过 到 邮局 使 
用 普通 邮件 通信 来 继续 她 们 的 对 话 ， 但 是 如 果 邮 件 被 拦截 了 ， 她 们 不 希望 别人 知晓 她 们 的 想 
法 。 她 们 在 邮件 的 加 密 /解密 方式 上 达成 了 一 致 ， 寄 信人 对 邮件 进行 加 密 ， 这 样 对 于 入 侵 者 
而 言 邮件 就 是 无 法 阅读 的 ; 同时 收 信人 对 邮件 进行 解密 以 得 到 原始 信件 。 第 16 章 将 讨论 加 
密 /解密 方法 ,但 是 现在 我 们 可 以 推测 Maria 和 Ann 使 用 了 其 中 一 种 使 没有 密 钥 的 人 很 难 对 
信件 进行 解密 的 技术 。 这 样 ， 可 以 把 Maria 和 Ann 之 间 的 通信 分 成 三 个 协议 层 ， 如 图 6-5 所 
示 。 假 设 Ann 和 Maria 都 各 自 拥 有 三 台 机 器 (或 机 器 人 ) 来 完成 每 一 个 协议 层 的 任务 。 








Maria 个 Ann 个 
层 3 层 3 
层 2 层 2 
发 送 邮件 / 发 送 邮件 / 
层 !1 YT 1 


= -一 2 ip 件 攻 二 本 


ED DER 
邮政 运营 设施 
图 6-5 一 个 三 层 协议 
让 我 们 假设 Maria 将 第 一 封 邮件 寄 给 Ann。Maria 假设 第 三 协议 层 机 器 是 正在 听 她 说 话 
的 Ann 并 对 其 说 话 ， 第 三 协议 层 的 机 器 听 她 说 话 并 且 创 作出 明文 (一 封 用 英语 写 的 信 )， 并 
被 传送 到 第 二 层 的 机 器 ， 第 二 协议 层 的 机 器 对 文本 进行 加 密 ， 将 它 创 作成 密 文 ， 并 传送 到 第 
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一 协议 层 的 机 器 。 这 个 第 一 协议 层 的 机 器 ， 也 许 是 一 个 机 器 人 ， 把 密 文 装 进 信封 ， 加 上 发 信 
人 和 收 信人 地 址 ， 然 后 将 信 寄 出 。 

在 Ann 这 边 ， 第 一 协议 层 的 机 器 从 Ann 的 邮箱 中 取出 邮件 并 通过 发 信人 地 址 找 出 来 自 
Maria 的 这 一 封 。 它 从 信封 中 取出 密 文 并 传递 给 第 二 协议 层 的 机 器 ， 第 二 协议 层 的 机 器 对 密 
文 进行 解密 ， 创 作出 明文 并 传递 给 第 三 协议 层 的 机 器 ， 第 三 协议 层 的 机 器 接受 明文 并 且 将 它 
读 出 来 ， 就 像 Maria 在 说 话 一 样 。 

协议 分 层 使 我 们 可 以 将 大 任务 化 简 成 几 个 更 小 、 更 简单 的 任务 。 例 如 ， 在 图 6-5 中 我 
们 可 以 只 用 一 台 机 器 来 完成 三 台 机 器 全 部 的 工作 ， 但 是 ， 如 果 Maria 和 Ann 觉得 机 器 完成 
的 现 有 加 密 或 解密 无 法 保证 她 们 的 保密 ， 她 们 需要 替换 整个 机 器 。 她 现在 的 情况 下 ， 她 们 
只 需要 替换 第 二 协议 层 的 机 器 就 足够 了 ， 另 外 两 层 可 以 保持 不 变 ; 这 称 为 模块 化 。 在 这 里 
模块 化 指 的 是 独立 的 协议 层 。 一 个 协议 层 (模块 ) 可 以 定义 为 一 个 具有 输入 和 输出 而 不 需 
要 考虑 输入 是 如 何 变 成 输出 的 黑匣子 。 当 向 两 台 机 器 提供 相同 输入 得 到 相同 输出 时 ， 它 们 
就 可 以 相互 替换 。 例 如 ，Ann 和 Maria 可 以 从 两 个 不 同 的 制造 商 那 里 购买 第 二 协议 层 的 机 
器 ， 只 要 两 台 机 器 可 以 利用 相同 的 明文 创作 出 相同 的 密 文 ， 反 之 亦 然 ， 她 们 就 可 以 完成 这 
个 工作 。 

协议 分 层 的 一 个 优势 就 是 可 以 将 服务 和 其 实施 分 开 来 。 每 层 使 用 更 低层 的 服务 ， 并 向 较 
高 一 层 提 供 服 务 ; 并 且 我 们 不 需要 考虑 该 层 是 如 何 实施 的 。 例 如 ，Maria 也 许 因为 可 以 自己 
完成 第 一 协议 层 的 工作 而 决定 不 买 第 一 协议 层 的 计算 机 (机 器 人 )。 只 要 Maria 可 以 完成 第 
一 协议 层 提供 的 工作 ， 这 个 通信 系统 就 可 以 正常 地 双向 运行 。 

协议 层 的 另 一 个 优势 ， 虽 然 在 简单 的 例子 中 无 法 看 出 ， 但 是 在 我 们 讨论 因特网 中 的 协议 
分 层 时 会 表现 出 来 ， 因 为 通信 系统 往往 不 仅仅 具有 两 个 端 系统 ， 还 有 一 些 只 需要 几 个 协议 层 
而 不 是 所 有 协议 层 的 中 间 系 统 。 如 果 我 们 不 使 用 协议 分 层 ， 整 个 系统 会 变 得 更 复杂 ， 因 为 那 
样 我 们 得 把 每 一 个 中 间 系 统 都 变 得 和 端 系统 一 样 复 杂 。 

协议 分 层 有 什么 劣势 吗 ? 也 许 有 人 会 认为 单一 协议 层 可 以 使 整个 工作 变 简 单 ， 而 且 没 
有 每 个 协议 层 都 使 用 低 一 级 协议 层 的 服务 并 向 高 一 级 协议 层 提供 服务 的 必要 。 例 如 ，Ann 
和 Maria 可 以 自己 制作 能 完成 三 项 任务 的 机 器 。 但 是 ， 就 像 之 前 提 到 的 那样 ， 一 旦 密码 被 破 
解 ， 她 们 每 一 个 人 就 得 将 整个 机 器 换 成 新 的 而 不 是 仅仅 更 换 第 二 协议 层 。 

2. 协议 分 层 的 原则 

我 们 讨论 一 下 协议 分 层 的 原则 。 第 一 条 原则 规定 ， 如 果 我 们 想 达 到 双向 通信 ， 我 们 需要 
保证 每 一 个 协议 层 都 可 以 进行 两 个 对 立 且 方 向 相反 的 工作 。 例 如 ， 第 三 协议 层 的 工作 是 去 听 
(在 一 个 方向 上 ) 和 说 (在 另 一 个 方向 上 )， 第 二 协议 层 同 时 需要 能 够 进行 加 密 和 解密 工作 ， 
第 一 协议 层 需要 发 送 和 接收 邮件 。 

在 协议 分 层 中 ， 我 们 需要 遵守 的 第 二 条 重要 原则 是 在 两 个 站 点 中 每 一 层 的 两 个 对 象 必须 
完全 相同 。 例 如 ， 在 两 个 站 点 中 第 三 层 的 对 象 都 应 该 是 明文 信件 ， 而 在 两 个 站 点 中 第 二 层 的 
对 象 都 应 该 是 密 文 信件 ， 在 第 一 层 则 都 是 一 封 信 。 

3. 逻辑 连接 

在 遵循 以 上 两 条 原则 之 后 ， 我 们 可 以 如 图 6-6 所 示 理 解 每 个 协议 层 之 间 的 逻辑 连接 。 这 
说 明了 层 与 层 之 间 通 信和 的 存在 。Maria 和 Ann 可 以 认为 她 们 能 够 发 送 该 协议 层 创作 的 对 象 是 
基于 每 层 的 逻辑 (假想 的 ) 连接 。 逻 辑 连接 的 概念 会 帮助 我 们 更 好 地 理解 在 数据 通信 和 建立 
数据 关系 网 络 中 遇 到 的 分 层 工作 。 
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6.1.5 TCPI/IP 协议 族 

通过 第 二 个 场景 我 们 了 解 了 协议 分 层 和 协议 层 之 间 的 逻辑 通信 ， 这 样 就 可 以 介绍 传输 控 
制 协议 / 网 际 协议 (TCP/IP)。 如 今 因特网 中 使 
用 的 协议 集 (一 组 通过 不 同 分 层 进行 组 织 的 协 
议 ) 被 称 为 TCP/IP 协议 族 。TCP/IP 协议 族 是 层 4 
一 个 分 层 协议 ， 它 由 提供 特定 功能 的 交互 式 模 
块 组 成 。 分 层 这 个 术语 说 明 每 一 个 高 层 协议 都 
基于 一 个 或 多 个 低层 协议 提供 的 服务 。TCP/IP 
协议 族 被 定义 成 图 6-7 所 示 布 局 的 软件 层 。 

1. 分 层 架 构 

为 了 展示 TCP/IP 协议 族 中 的 分 层 是 如 何在 加 69 TCR 协 说 效 中 的 分 民 
两 台 主 机 通信 中 作用 的 ， 我 们 假设 要 使 用 的 一 套 东 西 是 在 一 个 由 3 个 LAN (链接 ) 构成 的 小 
网 络 ， 且 链 路 层 开 关 与 每 个 LAN (链接 ) 相连 。 同 时 我 们 假定 这 些 链接 都 与 同一 个 路 由 器 相 
连 ， 如 图 6-8 所 示 。 


源 (A) 目标 (B) 








图 6-8 通过 因特网 通信 
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我 们 假设 计算 机 A 与 计算 机 B 通信。 如 图 6-8 所 示 ， 在 这 个 通信 中 有 5 个 通信 设备 : 
源 主机 (计算 机 A)、 链 接 1 中 的 链 路 层 开 关 、 路 由 器 、 链 接 2 中 的 链 路 层 开关 、 目 标 主 机 
(计算 机 B)。 每 个 设备 涉及 的 层 组 都 由 其 在 网 络 上 扮演 的 角色 所 涉及 的 层 组 决定 。 两 台 主 机 
都 涉及 5 个 协议 层 ， 同 时 源 主机 需要 在 应 用 层 中 创建 消息 并 将 其 通过 协议 层 向 下 发 送 ， 这 样 
这 条 消息 才能 物理 地 发 送 至 目标 主机 。 目 标 主机 需要 在 物理 层 接收 通信 并 通过 其 他 协议 层 将 
其 发 送 至 应 用 层 。 

路 由 器 只 涉及 三 个 层 ， 由 于 路 由 器 仅 用 来 路 由 ， 所 以 在 路 由 器 中 没有 传输 层 或 应 用 层 。 
虽然 路 由 器 总 是 包括 在 网 络 分 层 中 ,但 是 它 仅仅 被 包括 在 n 个 链接 和 物理 层 的 组 合 中 ， 这 里 
的 n 指 与 路 由 器 相连 的 链接 数 。 因 为 每 个 链接 都 可 能 使 用 它 自己 的 数据 链接 协议 或 物理 协 
议 。 例如， 在 上 面 这 张 图 中 ， 路 由 器 被 包含 在 3 个 链接 中 ,但 是 从 源 A 发 送 到 目标 B 的 消 
息 只 涉及 两 条 链接 。 每 个 链接 都 可 能 使 用 不 同 的 链 路 层 和 物理 层 协议 ， 所 以 路 由 器 需要 基于 
一 对 协议 接收 来 自 链接 1 的 数据 包 ， 然 后 基于 另 一 对 协议 将 其 数据 包 发 送 至 链接 2。 

然而 ， 链 接 中 的 链 路 层 开 关 只 涉及 两 个 协议 层 : 数据 链 路 层 和 物理 层 。 虽 然 图 6-7 中 的 
每 个 开关 都 有 两 个 不 同 的 连接 ， 但 是 这 些 连 接 都 在 同一 个 链接 中 ， 这 些 链接 仅 使 用 一 组 协 
议 。 这 一 点 说 明 与 路 由 器 不 同 的 是 ， 链 路 层 开 关 只 涉及 一 个 数据 链 路 层 和 一 个 物理 层 。 

2. 地 址 和 数据 包 名 称 

在 因特网 中 ， 另 外 两 个 和 协议 分 层 有 关 的 概念 很 值得 一 提 ， 它 们 是 地 址 和 数据 包 名 称 。 
就 像 我 们 在 之 前 讨论 过 的 那样 ， 在 这 个 模型 中 ， 我 们 有 层 组 之 间 的 逻辑 通信 。 任 何 涉及 两 步 
校 验 的 通信 需要 两 个 地 址 : 源 地 址 和 目标 地 址 。 虽 然 看 上 去 我 们 需要 5$ 组 地 址 ， 每 个 协议 层 
一 组 ， 但 是 正常 情况 下 我 们 只 有 4 组 ， 因 为 物理 层 不 需要 地 址 。 这 是 由 于 物理 层 数据 交换 的 
单位 是 位 ， 这 使 它 无 法 得 到 地 址 。 图 6-9 展示 了 每 一 层 的 数据 包 名 称 和 地 址 。 


源 和 目的 地 址 





图 6-9 ”TCP/IP 协议 族 中 的 地 址 和 数据 包 名 称 


如 图 6-8 所 示 ， 协 议 层 和 在 该 协议 层 使 用 的 地 址 以 及 数据 包 名 称 之 间 存 在 联系 。 在 应 
用 层 ， 我 们 通常 使 用 名 称 来 定义 提供 服务 的 站 点 ， 比 如 someorg.com, 或 者 邮箱 地 址 ， 比 如 
somebody@coldmail.com。 在 传输 层 ， 地 址 被 称 为 端口 号 ， 这些 端口 号 的 作用 是 在 源 和 目的 之 
间 定 义 应 用 层 程 序 。 端 口号 的 作用 是 通过 各 程序 的 本 地 地 址 来 辨别 多 个 同时 运行 的 本 地 程序 。 
在 网 络 层 ， 这 些 地址 在 整个 因特网 范围 下 是 全 球 化 的 ， 网 络 层 的 地 址 独一无二 地 定义 了 该 设 
备 与 因特网 的 连接 。 链 路 层 地 址 ， 有 时 称 为 MAC 地 址 ， 是 在 本 地 定义 的 地 址 ， 每 一 个 链 路 层 
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地 址 在 计算 机 网 络 (局 域 网 (LAN) 或 广域网 (WAN)) 中 定义 一 个 特定 的 主机 或 者 路 由 器 。 


6.2 ”应 用 层 


在 简单 讨论 网 络 、 互 联网 络 和 因特网 之 后 ， 我 们 准备 好 了 来 进行 一 些 有 关 TCP/IP 协议 
族 中 每 一 层 的 讨论 。 我 们 从 第 5 层 向 第 1 层 进行 讨论 。 

TCP/IP 协议 族 的 第 5 层 叫 做 应 用 层 。 应 用 层 向 用 户 提供 服务 。 通 信 由 逻辑 连接 提供 ， 
也 就 是 说 ， 假 设 两 个 应 用 层 通 过 之 间 假 想 的 直接 连接 发 送 和 接收 消息 。 如 图 6-10 显示 了 逮 
辑 连 接 背 后 的 想法 。 


Sky Research 公 司 








到 其 他 ISP wunntn 


到 其 他 ISP wenensdw 


Scientific Books 在 线 书 商 
图 6-10 ”应 用 层 的 逻辑 连接 


上 图 显示 了 一 个 场景 ， 在 这 个 场景 中 ，Sky Research 科研 公司 工作 的 科学 家 需要 到 一 个 
叫做 Scientific Books 的 在 线 书 商 那 里 订购 一 本 与 她 的 研究 方向 有 关 的 书 。Sky Research 科 
研 公司 的 计算 机 的 应 用 层 和 Scientific Books 的 一 台 服 务 器 的 应 用 层 之 间 就 产生 了 逻辑 连接 。 
我 们 把 第 一 台 主 机 叫做 Alice， 第 二 台 主 机 叫做 Bob。 这 个 应 用 层 的 通信 和 是 逻辑 上 的 而 不 是 
物理 上 的 ， 也 就 是 说 ， 假 设 Alice 和 Bob 之 间 有 一 个 双向 的 逻辑 信道 来 发 送 和 接收 消息 ， 但 
是 实际 上 的 通信 和 则 如 图 6-10 所 示 通 过 一 些 设备 ( Alice、R2、R4、R、R7 和 Bob) 和 一 些 物 
理 信 道 产生 。 
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6.2.1 提供 服务 


应 用 层 与 其 他 层 不 同 的 地 方 在 于 ， 它 是 协议 族 中 的 最 高 层 。 在 这 层 中 的 协议 不 向 其 他 协 
议 提供 服务 ， 它 们 只 接收 在 传输 层 的 协议 提供 的 服务 。 这 意味 着 该 层 的 协议 可 以 轻易 去 除 。 
只 要 新 的 协议 可 以 使 用 传输 层 中 任意 一 个 协议 提供 的 服务 , 这 个 新 的 协议 就 可 以 添加 到 应 用 
层 上 。 

因为 应 用 层 是 唯一 向 因特网 用 户 提供 服务 的 层 ， 应 用 层 的 灵活 性 使 得 新 的 协议 可 以 很 容 
易 地 添加 到 网 络 上 ， 如 前 所 述 ， 这 个 情况 在 因特网 的 生命 周期 内 常常 出 现 。 当 因特网 最 初创 
造 出 来 时 ， 用 户 只 能 使 用 很 少 的 应 用 协议 ， 如 今 由 于 新 协议 的 添加 已 经 变 成 常态 ， 我 们 很 难 
给 出 现 有 协议 的 具体 数目 。 


6.2.2 ”应 用 层 模式 


很 清楚 的 一 点 是 ， 当 使 用 网 络 时 我 们 需要 两 个 应 用 程序 彼此 交互 : 其 中 一 个 应 用 程序 
在 世界 上 某 处 的 一 台 计算 机 上 运行 ， 另 一 个 在 世界 上 某 处 的 另 一 台 计 算 机 上 运行 。 这 两 个 程 
序 需 要 通过 网 络 基础 设施 互相 发 送 消息 。 然 而 ， 我 们 还 没有 讨论 这 些 程序 之 间 应 该 是 何 种 关 
系 。 两 个 应 用 程序 都 应 能 够 请 求 和 提供 服务 ， 或 者 这 些 应 用 程序 只 需要 其 中 的 一 个 或 另外 一 
个 功能 ? 在 网 络 的 生命 周期 中 ， 应 用 程序 发 展 出 了 两 种 模式 来 解答 这 个 问题 : 客户 机 - 服务 
器 模式 和 端 到 端 模式 。 这 里 简单 介绍 这 两 种 模式 。 

1. 传统 模式 : 客户 机 - 服务 器 模式 

较为 传统 的 模式 叫做 客户 机 - 服务 器 模式 。 这 直到 几 年 以 前 还 一 直 是 最 为 流行 的 一 种 
模式 。 在 这 种 模式 中 ， 服 务 提 供 者 是 一 个 应 用 程序 ， 叫 做 服务 器 进程 ， 这 个 进程 一 直 持续 运 
转 ， 等 待 男 一 个 叫做 客户 端 进程 的 应 用 程序 通过 因特网 连接 要 求 服务 。 通 常 一 些 服务 器 进程 
可 以 提供 某 特定 种 类 的 服务 ,但 是 向 这 些 服务 器 进程 请 求 服务 的 用 户 会 很 多 ， 因 此 很 多 服务 
器 进程 需要 一 直 运 行 ， 而 客户 端 进程 只 在 需要 时 运行 。 

虽然 在 客户 机 - 服务 器 模式 中 的 通信 和 是 在 两 个 应 用 程序 之 进行 的 ， 但 每 个 应 用 程序 的 角 
色 完 全 不 同 ， 也 就 是 说 ， 我 们 不 能 把 客户 端 程序 当成 服务 器 程序 运行 ， 反 之 亦 然 。 图 6-11 
展示 了 一 个 客户 机 - 服务 器 通信 的 例子 ， 在 这 里 三 个 客户 机 与 同一 个 服务 器 通信 以 获得 该 服 
务 器 提供 的 服务 。 





图 6-11 客户 机 - 服务 器 模式 的 例子 
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这 种 模式 的 一 个 问题 是 通信 负荷 集中 由 服务 器 承担 ， 这 说 明 服务 器 必须 是 一 台 极 为 强大 
的 计算 机 。 即 使 是 一 台 极 为 强大 的 计算 机 也 可 能 因为 大 量 客户 在 同一 时 间 尝 试 连接 到 服务 器 
而 过 载 。 另 外 一 个 问题 则 是 需要 服务 供应 商 愿 意 接受 这 个 成 本 并 为 某 一 特定 服务 建造 一 台 足 
够 强大 的 服务 器 ， 也 就 是 说 ， 该 服务 必须 向 服务 器 回报 相应 的 某 种 收入 来 鼓励 这 样 一 种 安排 。 

一 些 传统 服务 仍然 在 使 用 这 种 模式 ， 包 括 万 维 网 (WWW) 和 它 的 超 文本 传输 协议 
(HTTP)、 文 件 传 输 协 议 (FTP)、 安 全 外 壳 协 议 (SSH)、 邮 件 服务 ， 等 等 。 本 章 后 面 讨论 这 
些 协议 和 应 用 。 

2. 新 模式 : 端 到 端 模式 

端 到 端 模 式 (通常 缩写 为 P2P 模式 ) 是 一 个 新 的 模式 ， 这 种 模式 为 了 响应 一 些 新 应 用 的 
需求 而 形成 。 在 这 种 模式 中 ， 不 需要 一 个 一 直 运行 并 等 待 客户 端 进程 连接 的 服务 器 进程 。 这 
个 责任 是 在 端 与 端 之 间 共 享 的 。 一 台 与 网 络 相连 接 的 计算 机 可 以 在 一 个 时 间 段 提供 服务 又 在 
另 一 个 时 间 段 接收 服务 。 一 台 计 算 机 甚至 可 以 在 同一 时 间 提 供 和 接收 服务 。 图 6-12 展示 了 
这 种 模式 在 通信 时 的 一 个 例子 。 





图 6-12 ” 端 到 端 模式 的 例子 


这 个 模式 完全 适用 的 领域 之 一 是 网 络 电话 。 通 过 电话 通信 确实 是 一 个 端 到 端 活动 ; 任何 
一 方 都 没有 必要 一 直 运 行 来 等 待 另 一 方 的 呼叫 。 端 到 端 模式 可 以 使 用 的 另 一 个 领域 是 当 一 些 
计算 机 与 网 络 连 接 来 互相 共享 一 些 东 西 的 时 候 。 例 如 ， 当 一 个 网 络 用 户 有 一 个 需要 与 其 他 网 
络 用 户 共享 的 文件 时 ， 不 需要 将 这 个 文件 夹 变 成 服务 器 并 且 一 直 运 行 服务 端 进 程 来 等 待 其 他 
用 户 的 连接 和 获得 这 个 文件 。 

虽然 端 到 端 模式 被 证 明 更 易于 扩展 并 且 在 减少 对 长 时 间 运 行 和 维护 的 昂贵 服务 器 的 需求 
上 更 具有 成 本 效益 ,但 是 这 也 有 一 些 挑战 。 最 主要 的 挑战 是 安全 性 。 和 由 几 个 专属 服务 器 控 
制 的 服务 相 比 ， 在 分 散 的 服务 之 间 创 造 安全 的 通信 更 为 困难 。 另 一 个 挑战 则 是 适应 性 ， 看 起 
来 似乎 并 不 是 所 有 的 应 用 都 可 以 使 用 这 种 新 模式 。 例 如 ， 假 如 有 一 天 万 维 网 也 可 以 通过 端 到 
端 服务 实现 ， 并 不 是 很 多 网 络 用 户 都 可 以 准备 好 参与 的 。 


6.2.3 ”标准 化 客户 机 - 服务 器 应 用 


在 网 络 的 生命 周期 中 ， 发 展 出 了 几 种 客户 机 - 服务 器 应 用 程序 。 不 需要 重新 定义 它们 ， 
但 是 需要 理解 这 些 程序 的 作用 。 
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本 节选 择 6 个 标准 应 用 程序 。 我 们 从 HTTP 和 万 维 网 讲 起 ， 因 为 几乎 所 有 的 网 络 用 户 都 
使 用 它们 。 接 着 介绍 具有 高 网 络 传输 负荷 的 文件 传输 和 电子 邮件 应 用 。 然 后 解释 远程 登录 以 
及 它 是 如 何 通 过 使 用 TELNET 和 SSH 协议 做 到 的 。 最 后 讨论 DNS， 所 有 应 用 程序 都 使 用 这 
个 来 向 对 应 的 主机 IP 地 址 映射 应 用 层 标 识 符 。 

1. 万 维 网 和 超 文本 传输 协议 

本 节 将 介绍 万 维 网 (缩写 为 WWW 或 仅 是 Web)。 然 后 讨论 超 文本 传输 协议 (HTTP)， 
以 及 和 网 络 有 关 的 最 常用 的 客户 机 - 服务 器 应 用 程序 。 

万 维 网 

Web 是 具有 连接 分 布 在 世界 各 地 的 文档 中 信息 的 存储 库 。 这 个 存储 库 中 叫做 网 页 的 文档 
分 布 在 全 世界 并 且 相 关 的 文档 都 链接 在 一 起 。Web 的 普及 和 发 展 与 以 上 提 到 的 两 个 术语 有 关 : 
分 布 式 和 链接 。 分 布 促进 了 Web 的 发 展 ， 世 界 上 的 每 一 个 Web 服务 器 都 可 以 往 这 个 存储 库 
上 添加 一 个 新 网 页 并 且 告 知 所 有 网 络 用户 而 不 用 担心 导致 个 别 服务 器 过 载 。 链 接 使 一 个 网 页 
可 以 参考 存储 在 世界 上 另外 一 个 地 方 的 服务 器 中 的 另 一 个 网 页 。 网 页 之 间 的 链接 是 通过 一 个 
叫做 超 文本 的 概念 达到 的 ， 这 个 概念 的 引入 发 生 在 网 络 到 来 之 前 。 这 个 想法 是 当 文 档 中 出 
现 到 另外 一 个 文档 的 链接 时 ， 用 一 个 可 以 自动 检索 的 机 器 检索 系统 中 存储 的 另外 一 个 文档 。 
Web 将 这 个 想法 电子 化 了 : 当 用 户 点 击 链接 时 ， 就 会 检索 到 被 链接 的 文档 。 现 在 我 们 将 为 了 
描述 链接 的 文本 文档 而 创造 的 术语 超 文本 改 成 了 超 媒 体 ， 来 说 明 一 个 网 页 可 以 是 文本 文档 、 
图 像 、 音 频 文件 或 视频 文件 。 

今天 的 WWW 是 一 个 分 布 式 客户 机 - 服务 器 服务 , 在 这 个 服务 中 ， 客 户 可 以 通过 浏览 
器 来 访问 使 用 服务 器 的 服务 。 但 是 ， 提 供 的 服务 分 布 在 许多 地 方 ， 称 为 站 点 。 每 个 站 点 存储 
的 一 个 或 多 个 文档 称 为 网 页 。 然 而 ， 每 个 网 页 都 包含 到 相同 站 点 或 不 同 站 点 的 其 他 网 页 相连 
的 链接 。 换 名 话说 ， 一 个 网 页 可 以 很 简单 也 可 以 很 复杂 。 一 个 简单 的 网 页 不 包含 到 其 他 网 页 
的 链接 ， 一 个 复杂 的 网 页 则 拥有 一 个 或 多 个 到 其 他 网 页 的 链接 。 每 个 网 页 都 是 一 个 具有 名 称 
和 地 址 的 文件 。 

例 6.1 

假设 我 们 需要 检索 一 个 科技 文献 ， 这 个 文献 引用 了 另 一 个 文本 文件 和 一 个 较 大 的 图 片 。 
图 6-13 展示 了 这 个 情形 。 






B: 图 片 
C: 引用 文件 


图 6-13 例 6.1 
主要 文档 和 图 片 存 储 在 同一 站 点 的 两 个 分 开 的 文件 中 (文件 A 和 文件 B); 引用 的 文本 
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文件 存储 在 另 一 个 站 点 (文件 C)。 由 于 需要 处 理 3 个 不 同文 件 ， 如 果 想 看 见 整个 文档 需要 
3 个 事务 。 第 一 个 事务 (请 求 / 响应 ) 检索 主要 文档 (文件 A) 的 副本 ， 这 个 副本 中 有 第 二 个 
和 第 三 个 文件 的 相应 引用 (指针 )。 当 检索 并 浏览 到 主要 文档 的 副本 后 ， 用 户 就 可 以 点 击 图 
片 的 引用 并 调用 第 二 个 事务 ， 然 后 检索 到 图 片 的 副本 (文件 B)。 如 果 用 户 需 要 查看 引用 的 
文本 文件 的 内 容 ， 她 可 以 点 击 该 文件 的 引用 (指针 ) 以 调用 第 三 个 事务 并 且 检 索 到 文件 C 的 
副本 。 注 意 ， 虽 然 文件 A 和 了 B 都 存储 在 站 点 工 ， 但 它们 是 有 着 不 同名 称 和 地 址 的 独立 文件 。 
检索 它们 需要 调用 两 个 事务 。 我 们 需要 记得 的 很 重要 的 一 点 是 例 6.1 中 的 文件 A、B 和 C 都 
是 独立 的 网 页 ， 它 们 都 有 独立 的 地 址 和 名 称 。 虽 然 文 件 A 中 包含 文件 B 或 文件 C 的 引用 ， 
但 这 并 不 意味 着 这 些 文件 无 法 各 自 独立 地 检索 到 。 第 二 个 用 户 可 以 通过 一 个 事务 检索 到 文件 
B。 第 三 个 用 户 可 以 通过 一 个 事务 检索 到 文件 C。 

2. 客户 端 (浏览 器 ) 

各 种 各 样 的 供应 商 提 供 了 能 解释 和 显示 网 页 的 商用 浏览 器 。 它 们 几乎 使 用 了 相同 的 体系 
结构 。 每 个 浏览 器 通常 由 三 部 分 构成 : 控制 器 、 客 户 端 协议 和 解释 器 。 

控制 器 接收 来 自 键盘 或 鼠标 的 输入 ， 使 用 客户 端 程序 存 取 文 档 。 在 文档 被 存 取 之 后 ， 控 
制 器 使 用 一 个 解释 器 在 屏幕 上 显示 文档 。 客 户 端 协议 可 以 是 稍 后 要 描述 的 协议 中 的 一 种 ， 如 
HTTP 或 FTP。 根 据 文档 类 型 ， 解释 器 可 以 是 HTML、Java 或 JavaScript。 一 些 商业 浏览 器 
包括 Internet Explorer、Netscape Navigator 和 Firefox。 

3. 服务 器 

服务 器 存储 网 页 。 每 当 请 求 到 达 时 ， 相 应 的 文档 会 发 送 至 客户 端 。 

4. 统一 资源 定位 器 (URL) 

作为 文件 ， 网 页 需要 唯一 地 标识 符 来 将 它 和 其 他 网 页 区 分 开 来 。 定 义 一 个 网 页 需要 3 个 
标识 符 : 主机 、 端 口 和 路 径 。 然 而 ， 在 对 网 页 进行 定义 之 前 ， 需 要 告诉 浏览 器 我 们 想 要 使 用 
的 客户 机 - 服务 器 应 用 程序 ， 这 个 就 叫做 协议 。 这 意味 着 我 们 需要 4 个 标识 符 来 定义 网 页 ， 
第 一 个 是 用 来 得 到 网 页 的 工具 种 类 ， 和 一下 三 个 的 组 合 定义 目标 对 象 (网 页 ) 。 

e 协议 : 为 了 访问 网 页 需要 的 第 一 个 标识 符 是 客户 机 - 服务 器 程序 的 缩写 。 

e 主机 : 主机 标识 符 可 以 是 服务 器 的 IP 地 址 或 服务 器 的 特定 名 称 。 

e 端口 : 端口 号 通常 是 为 客户 机 - 服务 器 应 用 程序 预定 义 的 16 位 整数 。 

e 路 径 : 路 径 标识 该 文件 在 基本 的 操作 系统 中 的 名 字 和 位 置 。 这 种 格式 的 标识 符 通 常 

由 操作 系统 决定 。 

在 UNIX 操作 系统 中 ， 路 径 是 一 组 目录 名 跟着 文件 名 ， 在 路 径 中 用 斜 杠 把 目录 与 子 目录 
和 文件 分 开 。 

统一 资源 定位 器 (URL) 是 为 了 把 这 4 个 部 分 结合 起 来 而 设计 的 ， 如 下 所 示 ， 它 用 3 种 
不 同 的 分 隔 符 将 4 个 部 分 分 开 : 

protocol://host/path 大 多 数 时 间 用 

protocol://host:port/path ” 当 需 要 端口 号 时 使 用 

5. 超 文本 传输 协议 

超 文 本 传输 协议 (HTTP) 是 一 个 用 来 定义 如 何 编写 客户 机 - 服务 器 程序 以 便于 从 网 络 
中 检索 网 页 的 协议 。HTTP 客户 端 发 送 请 求 ， 服 务 器 返回 响应 。 服 务 器 使 用 的 端口 号 为 80， 
而 客户 机 使 用 临时 端口 号 。 
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6.2.4 ”文件 传输 协议 


文件 传输 协议 (FTP) 是 TCP/IP 提供 的 标准 协议 ， 用 于 从 一 台 计 算 机 复制 文件 到 另 一 
台 计 算 机 。 虽 然 从 一 个 系统 到 另 一 个 系统 的 文件 传输 看 起 来 简单 直接 ， 但 有 些 问 题 必 须 首 先 
处 理 。 例 如 ， 两 个 系统 可 能 使 用 不 同 的 文件 命名 约定 。 两 个 系统 也 可 能 有 不 同 的 方式 表示 数 
据 。 两 个 系统 有 不 同 的 目录 结构 。 所 有 这 些 问 题 都 被 FTP 使 用 非常 简单 优美 的 方法 解决 了 。 

图 6-14 显示 了 FTP 的 基本 模式 。 客 户 端 有 三 部 分 组 成 : 用 户 接口 、 客 户 端 控制 进程 和 
客户 端 数据 传输 进程 。 服 务 器 端 有 两 部 分 组 成 : 服务 器 控制 进程 和 服务 器 数据 传输 进程 。 控 
制 连接 建立 在 控制 进程 间 ; 数据 连接 建立 在 数据 传输 进程 间 。 


ch 客户 端 






本 地 文 


< 
me 


远程 文件 系统 


= 





图 6-14 文件 传输 协议 


命令 和 数据 的 分 开 传输 使 得 FTP 效率 更 高 。 控 制 连接 使 用 非常 简单 的 通信 规则 。 一 次 
只 需要 传输 一 行 命令 或 一 行 响应 。 另 一 方面 ， 数 据 连 接 却 需要 更 为 复杂 的 规则 ， 这 是 由 于 要 
传输 的 数据 是 多 种 多 样 的 。 

两 个 连接 的 生命 周期 

FTP 中 的 两 个 连接 有 着 不 同 的 生命 周期 。 控 制 连接 在 整个 交互 式 FTP 会 话 中 都 是 保持 
打开 的 ， 而 数据 连接 为 每 个 文件 传输 活动 打开 和 关闭 。 每 次 涉及 使 用 文件 传输 命令 时 ， 它 就 
打开 ,文件 传输 结束 后 ， 它 就 关闭 。 当 控制 连接 打开 时 ， 如 果 需 要 传输 多 个 文件 ， 数 据 连 接 
可 以 打开 和 关闭 多 次 。 


6.2.5 ”电子 邮件 


电子 邮件 (electronic mail 或 e-mail) 允许 客户 交换 信息 。 然 而 这 个 应 用 的 本 质 却 与 其 他 
讨论 过 的 应 用 不 一 样 。 在 HTTP 或 FTP 之 类 的 应 用 中 ， 服 务 器 程序 是 一 直 运 行 的 ， 等 待 客 
户 的 请 求 。 当 请 求 来 临时 ， 服 务 器 提供 服务 。 有 请 求 就 有 响应 。 但 是 这 个 情况 在 电子 邮件 中 
是 不 一 样 的 。 首 先 ， 电 子 邮件 被 认为 是 一 个 单 向 事务 。 当 Alice 给 Bob 发 邮件 时 ， 她 可 能 期 
待 收 到 回复 ， 但 是 这 不 是 一 个 指令 。Bob 可 能 回 也 可 能 不 回 。 如 果 他 确实 回复 了 ， 这 是 另 一 
个 单 向 事务 。 第 二 ， 让 Bob 运行 一 个 服务 器 程序 并 且 等 待 直到 有 人 向 他 发 邮件 这 既 不 可 行 
也 不 符合 逻辑 。Bob 可 能 在 他 不 使 用 时 将 计算 机 关闭 。 这 意味 着 客户 机 / 服务 器 编程 应 该 通 
过 另 一 种 途径 实现 : 使 用 一 些 中 间 计 算 机 (服务 器 )。 用 户 只 在 当 他 们 想 要 的 时 候 运 行 客户 
端 程序 ， 然 后 中 间 服 务 器 回应 客户 机 / 服务 器 模式 ， 就 像 下 一 节 要 谈论 的 那样 。 

体系 结构 

为 了 解释 电子 邮件 的 体系 结构 ， 我 们 给 出 了 一 个 常见 的 场景 ， 如 图 6-15 所 示 。 

在 这 个 常见 的 场景 中 ，Alice 和 Bob 分 别 是 发 件 人 和 收 件 人 ， 他 们 通过 LAN 或 WAN 与 
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两 个 电子 邮件 服务 器 相连 。 管 理 员 已 经 为 每 个 用 户 创建 了 一 个 邮箱 ， 用 来 存储 收 到 的 信息 。 
邮箱 是 服务 器 硬盘 的 一 部 分 ， 一 个 有 权限 限制 的 特殊 文件 。 只 有 邮箱 的 主人 可 以 进入 它 。 管 
理 员 已 经 创建 了 一 个 接 一 个 发 送 电子 邮件 到 互联 网 的 队列 系统 。 















UA: 用 户 代理 
MTA: 信息 传送 代理 
MAA: 信息 访问 代理 





邮件 服务 器 
图 6-15 常见 场景 


如 图 6-15 所 示 ，Alice 发 给 Bob 的 一 封 简单 邮件 的 过 程 需要 9 个 不 同步 又 。Alice 和 
Bob 使 用 了 三 个 不 同 的 代理 程序 : 用 户 代 理 (UA)、 信 息 传送 代理 (MTA) 和 信息 访问 代理 
(MAA)。 当 Alice 需要 向 Bob 发 送信 息 时 ， 她 运行 用 户 代理 程序 ， 准 备 信息 ， 然 后 发 送信 息 
到 她 的 邮件 服务 器 。 在 Alice 处 的 邮件 服务 器 使 用 队列 来 存储 信息 ， 等 待 发 送 。 信 息 需 要 通 
过 网 络 使 用 MTA 由 Alice 处 传 到 Bob 处 。 这 里 用 到 了 两 个 信息 传送 代理 : 一 个 客户 机 和 一 
个 服务 器 。 就 像 网 络 上 的 其 他 客户 机 - 服务 器 程序 一 样 ， 服 务 器 需要 一 直 运行 ， 因 为 它 不 知 
道 何 时 会 有 客户 要 求 连接 。 另 一 方面 ， 当 队列 中 有 一 个 邮件 将 要 发 送 时 ， 客 户 机 可 以 被 系统 
触发 。 在 Bob 处 的 用 户 代理 允许 Bob 阅读 收 到 的 邮件 。 然 后 Bob 使 用 一 个 MAA 客户 端 从 
第 二 服务 器 上 运行 的 MAA 服务 器 检索 邮件 。 

Bob 需要 另 一 组 客户 机 - 服务 器 程序 : 信息 访问 程序 。 这 是 因为 MTA 客户 机 - 服务 器 
程序 是 推 人 程序 : 客户 机 将 消息 推 人 (上 载 ) 服务 器 。Bob 需要 一 个 拉 出 程序 ， 客 户 机 需要 
从 服务 器 拉 出 (下 载 ) 信息 。 很 快 我 们 要 讨论 有 关 MAA 的 更 多 内 容 。 


6.2.6 TELNET 


服务 器 程序 可 以 为 相应 的 客户 机 程序 提供 特定 的 服务 。 例 如 ，FTP 服务 器 使 FTP 用 户 
可 以 在 服务 器 上 存 取 文件 。 但 是 不 可 能 为 我 们 需要 的 每 一 种 服务 都 编写 一 对 客户 机 / 服务 
器 ; 服务 器 的 数量 很 快 就 会 变 得 难处 理 。 这 个 想法 是 不 现实 的 。 另 一 个 解决 方法 是 为 一 系列 
常用 场景 设置 一 个 特定 的 客户 机 / 服务 器 程序 ， 但 是 使 用 一 些 一 般 性 的 客户 机 / 服务 端 程序 ， 
这 样 的 程序 可 以 允许 用 户 在 客户 端 站 点 登录 服务 器 端 计算 机 ， 并 且 可 以 使 用 该 计算 机 上 可 用 
的 服务 。 例 如 ， 如 果 一 个 学 生 想 在 大 学 机 房 使 用 Java 编译 器 程序 ，Java 编译 器 客户 端 和 编 
译 器 服务 器 是 不 必要 的 。 这 个 学 生 只 需要 利用 一 个 客户 端 程序 登录 到 大 学 服务 器 ， 然 后 使 用 
大 学 的 编译 器 程序 。 我 们 把 这 些 一 般 性 的 客户 机 / 服务 器 对 称 为 远程 登录 应 用 。 

TELNET 是 终端 网 络 (TErminaL NETwork) 的 缩写 ， 是 最 早 的 远程 登录 协议 之 一 。 虽 
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然 TELNET 要 求 登 录 名 和 密码 ,但 是 面 对 黑客 行为 时 它 是 很 脆弱 的 ， 因 为 它 以 明文 形式 (不 
是 密 文 ) 发 送 所 有 数据 ， 包 括 密码 。 黑 客 可 以 窃听 并 且 得 到 登录 名 和 密码 。 由 于 这 个 安全 问 
题 ，TELNET 的 使 用 已 经 由 于 另 一 个 协议 〈 安 全 外 壳 协 议 )， 的 使 用 而 减少 。 下 一 节 讨 论 安 
全 外 壳 协 议 。 


6.2.7 ”安全 外 过 


虽然 现今 安全 外 壳 (SSH) 是 一 个 可 以 用 作 多 个 目的 (如 远程 登录 和 文件 传输 ) 的 安 
全 应 用 程序 ， 但 是 它 在 最 初 是 为 了 代替 TELNET 而 设计 的 。SSH 有 两 个 完全 不 兼容 的 版 本 : 
SSH-1 和 SSH-2。 第 一 个 版 本 (SSH-1 ) 现在 由 于 其 中 的 安全 漏洞 而 弃 用 ， 当 前 版 本 是 SSH-2。 


6.2.8 域名 系统 


我 们 讨论 的 最 后 一 个 客户 机 - 服务 器 应 用 程序 是 域名 系统 (DNS)， 这 个 程序 是 为 了 帮 
助 其 他 应 用 程序 设计 的 。 为 了 确认 一 个 实体 ，TCP/IP 协议 族 使 用 唯一 定义 了 该 主机 和 网 络 
之 间 连 接 的 IP 地址。 但 是 ， 人 们 更 愿意 使 用 名 字 而 不 是 数字 化 的 地 址 。 因 此 ， 网 络 需 要 有 
一 个 可 以 将 名 称 映射 到 地 址 的 目录 系统 。 这 个 和 电话 网 络 是 相似 的 。 电 话 网 络 为 了 使 用 电话 
号 码 而 非 姓 名 而 设计 。 人 们 可 以 保存 一 份 私 人 文件 来 将 名 字 映 射 到 相应 电话 号 码 ， 也 可 以 直 
接 通过 电话 禾 来 打 电 话 。 

由 于 如 今 的 网 络 如 此 巨大 ， 一 个 中 央 目 录 系 统 无 法 承担 所 有 的 映射 工作 。 除 此 之 外 ， 如 
果 中 央 计 算 机 出 故障 了 ， 那 么 整个 通信 和 网络 就 会 瘫痪 。 更 好 的 解决 方法 是 将 信息 分 布 到 世界 
上 的 很 多 台 计 算 机 上 。 通 过 这 个 方法 ， 需 要 进行 映射 的 计算 机 可 以 与 掌握 必要 信息 的 最 近 的 
一 台 计 算 机 联系 。 图 6-16 展示 了 TCP/IP 协议 族 如 何 利用 一 个 域名 系统 客户 端 和 一 个 域名 系 
统 服务 器 来 将 一 个 名 称 映 射 到 一 个 地 址 上。 用 户 想 通 过 使 用 文件 传输 客户 端 访问 远程 主机 上 
运行 的 相应 文件 传输 服务 器 。 用 户 只 知道 文件 传输 服务 器 的 名 字 ， 比 如 afilesource.com。 但 
是 TCP/IP 协议 族 需 要 文件 传输 服务 器 的 IP 地 址 来 进行 连接 。 下 面 6 个 步骤 将 主机 名 映射 到 
IP 地 址 上 : | 





图 6-16 DNS 的 目的 


1 ) 用 户 将 主机 名 传递 给 文件 传输 客户 端 。 

2 ) 文件 传输 客户 端 将 主机 名 传递 给 域名 系统 客户 端 。 

3 ) 每 台 计 算 机 在 启动 之 后 得 知 一 台 域 名 系统 服务 器 的 地 址 。 域 名 系统 客户 端 发 送 消息 
和 查询 给 域名 系统 服务 器 ， 查 询 利 用 已 知 的 域名 系统 服务 器 的 IP 地 址 命名 文件 传输 服务 器 。 
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4 ) 域名 系统 服务 器 给 出 需要 的 文件 传输 服务 器 的 IP 地 址 。 

5 ) 域名 系统 客户 端 将 IP 地 址 传输 给 文件 传输 服务 器 。 

6 ) 文件 传输 客户 端 现 在 使 用 得 到 的 IP 地 址 访问 文件 传输 服务 器 。 

1. 命名 空间 

确切 地 说 ， 给 一 个 机 器 指定 的 名 称 必须 从 一 个 对 于 名 称 和 IP 地 址 之 间 绑 定 有 完全 控制 权 
的 命名 空间 中 选择 。 换 句 话 说 ， 因 为 地 址 唯一 ， 所 以 名 称 也 应 当 是 唯一 的 。 命 名 空间 可 以 把 
每 一 个 地 址 映射 到 一 个 唯一 的 名 称 上 ， 这 些 名 称 通常 按照 分 层 进行 组 织 。 在 一 个 分 层 的 命名 
空间 内 ， 每 个 名 字 由 几 部 分 组 成 。 第 一 部 分 定义 组 织 的 本 质 ， 第 二 部 分 定义 组 织 的 名 称 ， 第 
三 部 分 定义 组 织 中 的 部 门 ， 等 等 。 在 这 里 ， 命 名 空间 的 分 配 和 控制 权 可 以 是 分 散 的 。 中 心机 
构 可 以 分 配 一 部 分 名 称 ， 这 些 名 称 对 组 织 的 本 质 和 名 称 进行 定义 。 名 称 剩 下 部 分 的 职责 则 由 
组 织 本 身 给 出 。 组 织 可 以 通过 向 名 称 添加 后 缀 (或 前 级) 来 定义 它 的 主机 或 资源 。 组 织 在 进行 
管理 时 不 需要 因为 它 为 主机 选择 的 前 缀 为 另 一 组 织 使 用 而 担心 ， 因 为 即使 一 部 分 主机 地 址 相 
同 ， 整 个 主机 地 址 是 不 一 样 的 。 例 如 ， 假设 两 个 组 织 都 把 他 们 各 自 的 一 台 计 算 机 称 为 caesar。 
中 心机 构 给 第 一 个 组 织 的 名 称 ， 比 如 是 first.com， 给 第 二 个 组 织 的 名 称 则 是 second.com。 当 
两 个 组 织 都 把 名 称 caesar 添加 到 他 们 已 经 被 指定 的 名 称 上 时 ， 最 终结 果 是 两 个 不 同 的 名 称 : 
caesar.first.com 和 ceasar.second.com。 名 称 是 唯一 的 。 

2. 网 络 中 的 域名 系统 

DNS 是 一 个 可 用 于 不 同 平台 的 协议 。 在 网 络 中 ,域名 空间 ( 树 ) 最 初 分 为 三 个 不 同 部 
分 : 一 般 域 、 国 家 域 和 反 相 域 。 然 而 ， 由 于 网 络 的 快速 发 展 ， 跟 踪 反 相 域 变 得 极为 困难 ， 这 
里 反 相 域 的 作用 是 在 设置 IP 地 址 时 找到 该 主机 的 名 称 。 反 相 域 现在 已 经 不 再 使 用 ( 见 RFC 
3425 )， 因 此 我 们 的 注意 力 集中 在 前 两 个 。 

(1 ) 一 般 域 

一 般 域 根据 注册 主机 的 一 般 行为 对 它们 进行 定义 。 树 上 的 每 一 个 节点 定义 一 个 域 ， 这 些 
节点 是 域名 空间 数据 库 的 索引 ( 见 图 6-17 ) 。 通 过 这 个 树 ， 我 们 可 以 看 到 在 一 般 域 部 分 的 第 
一 层 允 许 14 个 可 能 的 标签 。 这 些 标签 描述 了 表 6-1 中 陈列 的 组 织 类 型 。 
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6-17 一 般 域 
表 6-1 一 般 域 标签 
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( 续 ) 
三 本 网 络 供应 商 


(2 ) 国家 域 

国家 域 部 分 使 用 两 个 字符 组 成 的 国 
家 缩写 (例如 ，us 作为 United States 的 
缩写 ) 。 第 二 个 标签 可 以 是 编制 的 ， 也 可 
以 是 更 特定 的 国 别称 号 。 例 如 ， 美 国 用 
州 的 缩写 作为 国 别 缩写 us 的 细 分 (例如 ， 
ca.us)。 图 6-18 展示 了 国家 域 部 分 。 地 址 
uci.ca.us 可 以 翻译 为 美国 加 利 福 尼 亚 州 的 
加 州 大 学 欧文 分 校 。 图 6-18 ”国家 域 


6.2.9” 端 到 端 模 式 


本 章 前 面 讨论 了 客户 机 - 服务 器 模式 。 端 到 端 文件 共享 的 第 一 个 范例 可 以 追溯 到 1987 
年 12 月 ， 当 韦 恩 . 贝尔 创造 了 WWIV 网 , WWIV (第 四 次 世界 大 战 ) 公告 栏 软件 的 网 络 组 
件 。1999 年 7 月 ， 伊 恩 . 克拉克 设计 了 新 飞 网 (Freenet)， 一 个 分 散 且 抗 审查 的 分 布 式 数据 
存储 ， 旨 在 通过 一 个 端 到 端 网 络 为 言论 自由 提供 具有 匿名 性 的 强 有 力 的 保障 。 

端 到 端 随 着 肖 恩 : 范 宁 创造 的 一 个 Napster ( 1999 一 2001 ) 的 在 线 音 乐 文件 分 享 服务 逐 
渐 受 到 欢迎 。 虽 然 用 户 自 由 复制 和 传播 音乐 文件 的 行为 引起 了 对 Napster 的 一 个 侵权 诉讼 并 
且 导 致 了 该 服务 的 关闭 ， 但 它 为 后 来 的 端 到 端 文件 分 布 模型 奠定 了 基础 。Gnutella 首次 于 
2000 年 3 月 发 布 。 紧 随 其 后 ，(Kazza 使 用 的 ) 快 道 协议 (FastTrack)、BT 下 载 (BitTorrent)、 
WinMX 和 吉 牛 网 (GNUnet) 也 各 自在 2001 年 3 月 、4 月 、5 月 和 11 月 相继 发 布 。 

准备 好 共享 他 们 资源 的 网 络 用 户 成 为 同位 体 并 逐渐 构成 网 络 。 当 网 络 中 的 一 个 同位 体 有 
可 共享 的 文件 (例如 ， 一 个 音频 或 视频 文件 ) 时 ， 这 个 文件 对 于 其 他 同位 体 而 言 是 可 获得 的 。 
感 兴趣 的 同位 体 可 以 与 存储 该 文件 的 计算 机 连接 并 下 载 这 个 文件 。 在 一 个 同位 体 下 载 这 个 文 
件 之 后 ， 这 个 文件 可 用 于 其 他 同位 体 的 下 载 。 随 着 更 多 同位 体 加 入 和 下 载 该 文件 ， 这 个 文件 
的 更 多 副本 就 会 提供 到 组 中 。 由 于 同位 体 列 表 可 能 增长 也 可 能 收缩 ， 因 此 问题 是 该 模式 应 当 
如 何 跟踪 忠实 的 同位 体 和 文件 位 置 。 为 了 回答 这 个 问题 ， 我 们 需要 把 端 到 端 (P2P) 模式 分 
成 两 类 : 集中 的 和 分 散 的 。 

1. 集中 网 络 

在 一 个 集中 的 端 到 端 网 络 中 ， 目 录 系 统 列 出 同位 体 和 它们 提供 了 什么 以 使 用 客户 机 - 服 
务 器 模式 , 但 是 文件 的 存储 和 下 载 都 使 用 端 到 端 模式 完成 。 由 于 这 个 原因 ， 集 中 P2P 网 络 
有 时 也 被 称 为 混合 P2P 网 络 。Napster 就 是 一 个 集中 P2P 的 例子 。 在 这 种 网 络 中 ， 一 个 同位 
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体 先 通过 一 个 中 央 服 务 器 注册 ， 然 后 同位 体 提 供 它 的 IP 地 址 和 它 准备 共享 的 文件 列表 。 为 
了 防止 系统 崩溃 , Napster 为 了 这 个 目的 使 用 了 多 个 服务 器 ， 虽 然 只 在 图 6-18 中 展示 了 一 个 。 

为 了 寻找 一 个 特定 文件 ， 同 位 体 向 主 服务 器 发 送 一 个 查询 要 求 。 服 务 器 在 它 的 目录 中 搜 
索 并 给 出 存 有 该 文件 副本 的 节点 的 卫 地址 。 同 位 体 连 接 这 些 节 点 之 一 并 下 载 文 件 。 随 着 节 
点 加 入 和 离开 同位 体 ， 这 个 目录 一 直 在 更 新 。 

集中 网 络 使 目录 的 维护 得 到 简化 但 是 也 造成 一 些 障 碍 。 访 问 目录 可 能 产生 巨大 的 流量 
并 使 系统 变 慢 。 这 些 中 心服 务 器 很 容易 受到 攻击 ， 如 果 它 们 全 都 出 现 故障 ， 整 个 系统 就 会 停 
机 。 因 此 Napster 的 中 心 组 件 最 终 要 为 其 版 权 败诉 以 及 最 终 在 2001 年 7 月 关闭 负责 。New 
Napster 由 罗 西 欧 (Roxio) 于 2003 年 带 回 ，Napster 2 现在 是 一 个 合法 的 付费 音乐 网 址 。 

2. 分 散 网 络 

分 散 P2P 网 络 不 依赖 于 集中 目录 系统 。 在 这 个 模型 中 ， 同 位 体 组 织 形 成 一 个 在 物理 网 
络 之 上 的 逻辑 网 络 ， 称 为 重 登 网 络 。 基 于 重 且 网络 中 节点 之 间 的 连接 方式 ， 分 散 P2P 网 络 
分 成 结构 化 的 和 未 结构 化 的 两 大 类 。 

在 一 个 未 结构 化 的 P2P 网 络 中 ， 节 点 随机 地 连 在 一 起 。 在 未 结构 化 的 P2P 中 进行 搜索 
不 是 很 有 效 ， 因 为 寻找 一 个 文件 的 查询 涌 和 网 络 并 造成 巨大 的 流量 ， 即 使 这 样 这 个 查询 请 求 
也 不 一 定 得 到 解决 。 这 种 网 络 的 两 个 例子 是 吉 牛 网 ( Gnutella) 和 新 飞 网 (Freenet)。 我 们 下 
面 将 把 吉 牛 网 作为 一 个 案例 。 

结构 化 的 网 络 使 用 一 组 预 设 的 规则 来 链接 节点 ， 这 样 一 个 查询 就 可 以 有 效 且 高 效 地 解 
决 。 为 了 达到 这 个 目的 ， 最 常用 的 技术 是 分 布 式 散 列表 (DHT)。 很 多 应 用 都 使 用 了 DHT， 
包括 分 布 式 数 据 结构 (DDS)、 内 容 分 布 式 系 统 (CDS)、 域 名 系统 (DNS) 和 了 P2P 文件 共享 。 
一 个 使 用 DHT 的 常用 P2P 文件 共享 协议 是 BT 下 载 。 我 们 将 在 下 一 节 中 把 DHT 作为 一 个 既 
可 以 在 结构 化 P2P 网 络 也 可 以 在 其 他 系统 中 使 用 的 技术 单独 讨论 。 


6.3 ”传输 层 


TCP/IP 协议 族 中 的 传输 层 位 于 应 用 层 和 网 络 层 之 间 ， 它 从 网 络 层 接收 服务 并 且 为 应 用 
层 提 供 服 务 。 传 输 层 作为 一 个 客户 程序 和 服务 器 程序 之 间 的 联络 ， 是 一 个 过 程 间 连接 。 传 输 
层 是 TCP/IP 协议 族 的 核心 部 分 ， 它 是 一 个 在 网 络 中 从 一 点 向 另 一 点 进行 数据 传输 的 端 与 端 
之 间 逻 辑 媒 介 。 图 6-19 展示 了 逻辑 连接 的 思想 。 

这 幅 图 展示 的 场景 和 我 们 用 在 应 用 层 的 是 相同 的 。Alice 在 Sky Research 科研 公司 的 
主机 和 Bob 在 Scientific Books 公司 的 主机 在 传输 层 建立 了 一 个 逻辑 连接 。 这 两 个 公司 在 
计算 机 传输 层 通信 ， 就 像 在 它们 之 间 有 一 个 真正 的 连接 一 样 。 图 6-19 显示 只 有 两 个 端 系统 
(Alice 的 和 Bob 的 计算 机 ) 在 使 用 传输 层 服务 ， 所 有 的 中 间 路 由 器 都 只 使 用 了 前 三 层 。 


6.3.1 传输 层 服务 


本 节 讨 论 传输 层 可 以 提供 的 服务 ， 下 一 节 讨论 几 种 传输 层 协议 。 

1. 进程 间 通 信 

传输 层 的 第 一 个 义务 是 提供 进程 间 通 信 。 一 个 进程 是 使 用 传输 层 服务 的 应 用 层 实体 ( 运 
行 中 的 程序 )。 

网 络 层 (在 下 一 节 介 绍 ) 负责 在 计算 机 层面 的 通信 (主机 间 通 信 )。 网 络 层 协议 只 能 将 
信息 传输 到 目的 计算 机 。 然 而 ， 这 是 一 个 不 完整 的 传递 ， 这 个 消息 仍然 需要 被 传递 给 正确 的 
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6-19 ”传输 层 的 逻辑 连接 





进程 。 这 就 是 传输 层 协议 的 工作 ， 它 的 传输 层 协议 域 
责任 是 将 消息 送 抵 相 应 的 进程 。 图 6-20 
显示 了 网 络 层 和 传输 层 的 域 。 
2. 地 址 : 端口 号 ee 
虽然 有 几 种 办 法 来 完成 进程 间 通 信 ， 图 6-20 网 络 层 与 传输 层 


但 最 常用 的 还 是 通过 客户 机 - 服务 器 模式 (之 前 介绍 过 )。 在 主机 上 的 进程 叫做 客户 程序 ， 
客户 程序 需要 来 自 通常 运行 在 远程 主机 上 的 进程 提供 的 服务 ， 这 个 运行 在 远程 主机 上 的 进 
程 叫做 服务 器 程序 。 这 两 个 进程 (客户 和 服务 器 程序 ) 有 着 相同 的 名 称 。 例 如 ， 为 了 从 一 个 
远程 机 器 上 得 到 日 期 和 时 间 ， 我 们 需要 一 个 daytime 客户 程序 进程 在 本 地 主机 上 运行 和 一 个 
daytime 服务 器 程序 在 远程 机 器 上 运行 。 一 个 远程 计算 机 可 以 同时 运行 多 个 服务 器 程序 ， 就 
像 一 个 或 多 个 客户 程序 可 以 同时 在 多 个 本 地 计算 机 上 运行 一 样 。 为 了 通信 ， 我 们 必须 定义 本 
地 主机 、 本 地 进程 、 远 程 主机 和 远程 进程 。 本 地 主机 和 远程 主机 用 IP 地 址 进行 定义 (在 下 
一 节 讨 论 ) 。 为 了 定义 这 些 进 程 ， 我 们 需要 第 二 个 标识 符 ， 称 为 端口 号 。 在 TCP/IP 协议 族 
中 ， 端 口号 是 0 和 65 535 (16 位 ) 之 间 的 整数 。 

用 来 定义 客户 程序 的 端口 号 叫做 临时 端口 号 。 临 时 这 个 词 的 意思 是 短命 的 ， 用 在 这 里 是 
因为 客户 程序 的 使 用 寿命 通常 很 得。 临时 端口 号 建议 使 用 大 于 1023 的 数 ， 这 样 一 些 客户 / 服 
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务 器 程序 才能 正常 运行 。 服 务 器 程序 也 必须 定义 一 个 端口 号 。 然 而 ， 这 个 端口 号 不 可 以 随 
机 选择 。TCP/IP 协议 族 已 经 决定 给 服务 器 使 用 通用 端口 号 ， 这 些 端 口号 被 称 为 知名 端口 号 ， 
每 一 个 客户 进程 知道 相应 服务 器 进程 的 知名 端口 号 。 例 如 ， 当 前 面谈 到 的 daytime 客户 进程 
用 临时 端口 号 52000 来 标识 自己 ，daytime 服务 器 进程 必须 使 用 知名 端口 号 13。 网 6-21 展 
示 了 这 个 概念 。 


daytime 客 户 程序 daytime 服 务 器 程序 
于 斑 J 13 时 
传输 层 传输 层 
图 6-21 端口 号 
6.3.2 ”传输 层 协议 


虽然 因特网 使 用 了 一 些 传输 层 协议 ， 但 在 本 书 我 们 只 讨论 两 种 : UDP (用 户 数据 报 协议 ) 
和 TCP (传输 控制 协议 )。 

1. 用 户 数 据 报 协 议 

用 户 数据 报 协 议 ( UDP) 是 不 可 靠 的 无 连接 传输 协议 。 它 除了 提供 进程 间 通 信和 市 不 是 
主机 间 通 信 以 外 ， 没 有 向 网 络 层 服务 添加 任何 东西 。 如 果 UDP 这 么 无 能 为 力 ， 为 什么 一 
个 进程 会 想 要 使 用 它 呢 ? 这 个 缺点 的 同时 也 是 它 的 优点 。UDP 是 一 个 极 简单 同时 开销 最 少 
的 协议 。 如 果 一 个 进程 想 要 发 送 一 条 短 的 消息 且 不 关心 可 靠 性 ， 那 么 就 可 以 使 用 UDP。 通 
过 UDP 发 送 一 条 短 的 消息 比 用 TCP 发 送 造 成 的 发 送 者 和 接收 者 之 间 的 互动 要 少 得 多 . 

用 户 数 据 报 

UDP 数据 包 ， 也 叫做 用 户 数据 报 ， 有 一 8~65 535 字 节 
个 固定 大 小 为 8 字 节 的 头 。 图 6-22 展示 了 用 SS 
户 数据 报 的 格式 。 然 而 ， 由 于 UDP 用 户 数据 “位 传输 方向 2 
报 是 存储 在 总 长 度 为 65 535 字 节 的 IP 数据 图 6-22 用户 数据 报 的 数据 包 格式 
报 中 的 ， 所 以 其 整体 长 度 会 比较 短 。 

2. 传输 控制 协议 

传输 控制 协议 (TCP) 是 一 个 面向 连接 的 可 靠 协 议 。 它 明确 地 定义 了 连接 设施 、 数 据 传 
输 和 连接 拆 印 段 以 提供 面向 连接 的 服务 。 这 里 面向 连接 的 服务 指 的 是 在 (来 自 应 用 层 的 ) 同 
一 消息 中 的 所 有 数据 包 ( 段 ) 之 间 有 连接 (关联 )。TCP 使 用 序列 号 来 定义 段 的 顺序 。 序 列 号 
与 每 一 段 的 字 节 数 有 关 。 比 如 在 一 个 6000 字 节 的 消息 中 ， 第 一 段 的 序列 号 是 0， 第 二 段 的 
序列 号 是 2000, 第 三 段 的 序列 号 是 4000 (实际 过 程 更 复杂 ， 我 们 尝试 对 其 进行 了 简化 )。 这 
样 ， 如 果 一 段 丢 失 了 ， 接 收 者 会 持 有 另外 两 段 直到 发 送 者 重 置 丢失 的 那 段 。 

段 

在 传输 层 ，TCP 将 一 些 字 节 组 合成 一 个 叫做 段 的 数据 包 。TCP 在 每 一 段 之 前 加 上 
一 个 头 〈 目 的 是 方便 控制 )， 并 且 将 这 些 
段 发 送 至 网 络 层 进行 传输 。 这 些 段 都 封 | 
装 在 IP 数 据 报 里 并 如 图 6-23 所 示 进 行 位 传输 方向 头 
传输 。 图 6-23 TCP 段 
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6.4 网 络 层 


TCP/IP 协议 族 中 的 网 络 层 负责 源 到 目的 地 (计算 机 到 计算 机 或 主机 到 主机 ) 的 消息 发 
送 。 图 6-24 展示 了 假设 Alice 和 Bob 的 计算 机 只 有 一 条 路 径 相 连 时 ， 他 们 在 网 络 层 的 通信 。 
上 边 两 节 使 用 同样 的 场景 分 别 介绍 了 应 用 层 和 传输 层 的 通信 。 

如 图 6-24 所 示 ， 源 主机 、 目 标 主机 和 路 径 中 的 所 有 路 由 器 (R2、R4、R5 和 R7 ) 都 涉 
及 网 络 层 。 在 源 主机 ( Alice) 处 ， 网 络 层 从 传输 层 接 收 了 一 个 数据 包 ， 它 将 数据 包 封 装 在 
一 个 数据 报 中 ， 并 且 发 送 至 数据 链 路 层 。 在 目标 主机 ( Bob) 处 ， 这 个 数据 报 就 被 解除 封装 ， 
取出 数据 包 并 发 送 至 相应 的 传输 层 。 虽 然 TCP/IP 协议 族 的 全 部 5 层 之 中 都 涉及 了 源 主机 和 
目的 主机 ， 如 果 只 为 数据 包 规定 路 线 ， 那 么 路 由 器 只 用 到 三 层 。 然 而 ， 他 们 为 了 进行 控制 会 
需要 传输 层 和 应 用 层 。 路 径 中 的 路 由 器 通常 与 两 个 数据 链 路 层 和 两 个 物理 层 同 时 展示 ， 因 为 
它 从 一 个 网 络 接收 数据 包 ， 然 后 将 该 数据 包 传 递 至 另 一 网 络 。 

Sky Research 公 司 Alice 

Alice 应 用 层 





到 其 他 ISP wn -> i ” 


到 其 他 ISP* 


[fj 网 络 层 
se 点 到 点 WAN z 山中 数据 链 路 层 
村 LAN 交 换 机 i [JU 物理 层 
贺 WwAN 交 换 机 A ~ 

> >” ah 
应 用 层 
传输 层 

注意 : 为 了 简单 ， 我 们 假设 从 源 Scientific Books 在 线 书 商 [本 | 网 络 层 

到 目标 只 有 一 条 可 用 路 径 [4 数据 链 路 层 

物理 层 


图 6-24 ”网络 层 通信 


6.4.1 网 络 层 提供 的 服务 
网 路 层 在 传输 层 的 下 面 ， 这 就 意味 着 网 络 层 要 向 传输 层 提 供 服 务 。 我 们 将 在 下 面 讨论 这 
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个 服务 的 几 个 方面 。 

1. 打包 

网 络 层 的 第 一 个 义务 就 是 定义 打包 : 在 源 主 机 的 网 络 层 数据 包 中 封装 有 效 负 荷 (从 上 一 
层 接收 的 数据 )， 并 且 从 来 自 目的 主机 网 络 层 的 数据 包 中 解 封 装 有 效 负 荷 。 换 句 话 说， 网 络 
层 的 一 个 责任 是 将 有 效 负 荷 不 加 改动 或 利用 地 从 源 送 到 目的 地 。 网 络 层 的 服务 就 是 一 个 邮 
局 式 的 传递 者 ， 它 负责 将 数据 包 从 发 送 者 送 至 接收 者 ， 同 时 保证 数据 包 的 内 容 不 被 改变 或 使 
用 。 如 图 6-25 所 示 ， 这 通过 三 个 步骤 完成 。 


注意 : 传输 层 负 荷 可 能 成 为 一 些 网 络 层 数 据 包 








图 6-25 在 网 络 层 打包 


1 ) 源 网 络 层 协议 从 传输 层 协议 接收 数据 包 ， 添 加 包含 源 地 址 和 目标 地 址 以 及 其 他 网 络 
层 协议 所 需 信 息 的 头 。 

2 ) 网 络 层 协议 在 逻辑 上 将 该 数据 包 传 递 至 目标 处 的 网 络 层 协议 。 

3 ) 目标 主机 接收 网 络 层 数 据 包 ， 解 除 有 效 负荷 的 封装 并 将 其 传输 至 上 一 层 协 议 。 

如 果 在 源 主机 或 在 路 径 中 的 路 由 器 处 时 数据 包 为 碎片 状 ， 网 络 层 有 责任 等 待 直到 所 有 碎 
片 到 达 ， 对 它们 重新 组 合并 发 送 至 上 层 协 议 。 

传输 层 的 有 效 负 荷 可 以 封装 在 几 个 网 络 层 数据 包 中 。 


2. 数据 包 传递 
网 络 层 的 数据 包 传递 是 无 连接 且 不 可 靠 的 。 接 下 来 我 们 简单 讨论 这 两 个 概念 。 
(1 ) 不 可 靠 传 递 


在 网 络 层 传递 的 数据 包 是 不 可 靠 的 ， 这 意味 着 这 些 数据 包 可 能 毁损 、 丢 失 或 者 重复 。 换 
句 话说， 网 络 层 提 供 的 是 尽力 而 为 的 传输 ， 但 是 它 不 能 保证 这 个 数据 包 如 我 们 所 期 待 的 那样 
到 达 目 的 地 。 这 个 服务 和 我 们 在 邮局 寄 一 封 平 信 时 所 使 用 的 是 一 样 的 。 不 管 是 邮局 还 是 网 络 
层 ， 这 个 都 可 以 通过 成 本 来 进行 解释 。 如 果 我 们 需要 邮局 提供 保证 ， 成 本 会 更 大 一 些 ( 比如 
挂号 信 )。 如 果 我 们 希望 网 络 层 提供 保证 ， 这 个 数据 包 的 传递 就 会 被 延迟 。 在 每 个 路 由 器 和 


目的 地 处 的 每 个 数据 包 都 需要 进行 检查 ， 如 果 出 现 筑 损 情 况 则 需要 重新 发 送 。 检 查 丢 失 的 数 


据 包 甚至 成 本 更 大 。 是 否 这 样 就 意味 着 我 们 通过 网 络 传送 的 消息 就 是 不 可 靠 的 呢 ? 答案 是 ， 
我 们 要 通过 使 用 传输 层 协 议 中 的 TCP 协议 才能 保证 消息 没有 毁损 。 如 果 在 传输 层 的 一 个 有 
效 负荷 (由 于 数据 链 路 层 的 不 可 靠 传递 ) 毁损 了 ，TCP 会 丢弃 这 个 数据 包 并 且 要 求 重新 发 送 。 
这 个 在 前 一 节 提 到 过 了 。 

(2 ) 无 连接 传递 

网 络 层 的 传递 也 是 无 连接 的 ， 但 是 这 里 的 无 连接 不 是 说 发 送 者 和 接收 者 之 间 没 有 物理 连 
接 ， 而 是 说 网 络 层 对 每 个 数据 包 的 处 理 是 单独 的 (就 像 邮 局 对 待 信件 的 那 种 方式 )。 换 句 话 
说 ， 属 于 相同 传输 层 有 效 负荷 的 数据 包 之 间 是 没有 联系 的 。 如 果 一 个 传输 层 数 据 包 由 4 个 网 
络 层 数据 包 构成 ， 那 么 无 法 保证 这 4 个 数据 包 到 达 的 顺序 与 它们 发 送 的 顺序 相同 ; 这 是 由 于 
每 个 数据 包 都 可 能 依照 不 同 的 路 径 到 达 目 的 地 。 图 6-26 展示 了 这 个 问题 的 原因 。 
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图 6-26 不 同 的 数据 包 传 递 路 径 


一 个 传输 层 数 据 包 分 成 了 4 个 网 络 层 数据 包 ， 它 们 按 顺序 发 出 (1，2，3，4), 但 是 收 
到 时 它们 的 顺序 是 乱 的 (2，4，3，1 )。 目 的 地 的 传输 层 负 责 等 待 和 接收 所 有 数据 包 再 将 它 
们 组 合 在 一 起 并 传送 至 应 用 层 。 

3. 路 由 

网 络 层 有 一 个 和 其 他 层 一 样 重要 的 职责 就 是 路 由 。 网 络 层 为 将 数据 包 从 它 的 源 传送 到 目 
的 地 而 负责 。 物 理 网 络 是 网 络 (LAN 和 WAN) 和 连接 这 些 网 络 的 路 由 器 的 集合 ， 这 意味 着 
从 源 到 目的 地 有 不 止 一 条 路 线 。 网 络 层 的 责任 是 在 这 些 可 能 的 路 线 中 找到 最 优 路 线 ， 它 需要 
有 一 些 特定 的 策略 来 定义 最 优 路 线 。 在 现在 的 网 络 中 , 这 个 得 通过 在 数据 包 到 达 时 运行 一 些 
路 由 协议 来 帮助 多 个 路 由 器 协调 它们 对 于 周边 的 知识 并 且 提 出 一 致 的 路 由 表 来 实现 。 


6.4.2 ”网络 层 协议 


虽然 在 网 络 层 有 很 多 协议 ,但 最 主要 的 协议 叫做 网 际 协议 (IP)。 其 他 协议 都 是 辅助 协 
议 ， 帮助 IP 完成 它 的 职责 。 如 今 有 两 类 网 络 协议 正在 投入 使 用 : IPv4 和 IPv6。 我 们 将 在 下 
面 分 别 讨论 。 

1. 第 4 版 网 际 协议 (IPv4 ) 

现在 大 多 数 系统 都 使 用 第 4 版 网 际 协议 (IPv4 ), 但 是 这 将 在 未 来 改变 ， 因 为 该 协议 的 
地 址 空间 和 数据 包 格 式 较 小 (以 及 其 他 原因 )。 

(1 ) IPv4 地 址 

在 TCP/IP 协议 族 的 Ipv4 层 中 用 来 标记 每 个 设备 和 互联 网 之 间 的 连接 的 标识 符 叫 做 网 络 
地 址 或 IP 地址 。IPv4 地 址 是 一 种 32 位 的 地 址 ， 这 种 地 址 唯一 但 又 通用 地 定义 了 主机 或 路 由 
器 与 网 络 之 间 的 连接 。 卫 地 址 是 连接 的 地 址 而 非 主机 或 路 由 器 的 地 址 ， 因 为 如 果 这 个 设备 移 
动 到 了 另外 一 个 网 络 中 ， 它 的 IP 地 址 可 能 会 改变 。IPv4 地 址 是 独一无二 的 ， 因 为 每 个 地 址 
定义 一 个 且 只 有 一 个 与 网 络 之 间 的 连接 。 如 果 一 个 设备 (例如 路 由 器 ) 有 多 个 网 络 连 接 ， 那 
么 它 就 有 多 个 IPv4 地 址 。IPv4 地 址 也 是 通用 的 ， 因 为 这 个 地 址 系统 必须 被 所 有 想 要 连接 到 
网 络 的 主机 接收 。 

有 三 种 较 普 遍 的 表示 法 来 表现 一 个 IPv4 地 址 : 二 进 制 表示 法 (以 2 为 底 )、 带 点 的 十 进 
制 表 示 法 (以 256 为 底 ) 和 十 六 进 制 表示 法 (以 16 为 底 )。 在 二 进 制 表示 法 中 ，IPv4 地 址 展 
示 为 32 位 。 为 了 使 地 址 更 便于 阅读 ， 每 8 位 之 间 会 添加 一 个 到 两 个 空格 。 每 8 位 一 般 被 看 
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作 一 个 字 节 为 了 使 IPv4 地 址 更 紧 潜 易 读 ， 它 通常 写成 十 进 制 的 形式 ,不同 字 节 利用 小 数 点 
分 开 。 这 个 格式 被 称 为 带 点 的 十 进 制 表 示 法 。 注 意 ， 由 于 每 个 字 节 (8 位 ) 只 有 8 位， 因此 
在 带 点 的 十 进 制 表 示 法 中 每 个 数字 都 在 0 ~ 255 之 间 。 我 们 有 时 候 把 IPv4 地 址 用 十 六 进 
制 表 示 。 每 个 十 六 进 制 数字 与 二 进 制 表示 二 进 制 | 10000001 ”00000011 00000011 00011010| 
法 中 的 4 位 等 同 ， 这 意味 着 一 个 32 位 的 Le ed 
地 址 由 8 个 十 六 进 制 数 字 构 成 。 这 种 十 六 带 点 的 十 进 制 D29 . 3 . 7 . 30 

进 制 表示 方法 通常 用 于 网 络 编程 。 图 6-27 

展示 了 用 讨论 的 三 种 方式 表示 同一 个 人 P Tu 

地 址 。 图 6-27 地 址 表示 

在 任何 涉及 传递 的 通信 系统 网 络 中 ， 如 电话 网 络 或 邮政 网 络 ， 地 址 系统 都 是 分 级 的 。 在 
邮政 网 络 中 ， 地 址 (通信 地 址 ) 包括 国家 、 州 (或 省 )、 城 镇 、 街 道 、 门 牌号 和 邮件 收 件 人 姓 
名 。 同 样 ， 电 话 号 码 也 分 成 国家 代码 、 地 区 代码 、 本 地 交换 和 连接 。 

32 位 的 IPv4 地 址 也 是 分 级 的 ， 但 是 只 分 成 两 个 部 分 。 地 址 的 第 一 部 分 叫做 前 缓 ， 定 义 
网 络 ; 地 址 的 第 二 部 分 叫做 后 级 ， 定 义 节点 (设备 和 网 络 的 连接 )。 图 6-28 展示 了 一 个 32 
位 IPv4 地 址 的 前 级 和 后 级 。 前 缀 的 长 度 是 nn 位 ,后缀 的 长 度 就 是 (32-n) 位 。 前 级 和 后 级 
的 长 度 取决 于 网 络 (组 织 ) 的 站 点 。 

(2 ) IPv4 数据 报 

IP 使 用 的 数据 包 叫 做 数据 报 。 图 6-29 展示 了 IPv4 数据 报 的 格式 。 数 据 报 是 一 种 长 度 
不 一 的 数据 包 ， 这 种 数据 包 包 括 两 部 分 : 头 和 有 效 负 荷 (数据 )。 头 的 长 度 是 20 ~ 60 字 节 ， 
并 且 他 包含 路 由 和 传递 时 必要 的 信息 。 注 意 ， 一 个 字 节 是 8 位 。 


32 位 
2 n 位 ,| 《32-n) 位 和 
CE 
Ey /全 义 与 节点 的 连接 20~65 535 字 节 
网 络 入 a 20~60 字 节 











20~ 60 字 节 
Jo 作 和 多 | 
of < 
图 6-28 JIPv4 地 址 中 的 分 层 图 6-29 IPv4 数据 报 


2. 第 6 版 网 际 协议 (IPv6 ) 

IPv4 的 一 些 地 址 耗 尽 之 类 的 缺点 促进 了 20 世纪 90 年 代 早期 IP 协议 的 一 种 新 版 本 的 出 
现 。 新 版 本 叫做 第 6 版 网 际 协议 (IPv6 ) 或 新 一 代 IP (IPng) 的 版 本 是 一 个 在 扩大 IPv4 的 地 
址 空间 的 同时 重新 设计 IP 数据 包 的 格式 并 修改 一 些 辅助 性 协议 的 计划 。 有 趣 的 是 ，IPv5 是 


一 个 从 未 实现 过 的 计划 。 下 面 展 示 了 IPv6 协议 中 的 主要 改变 。 


为 了 防止 地 址 耗 尽 ， IPv6 使 用 128 位 来 1111111011110111 eee 0001001101000101 
定义 任何 连接 到 网 络 的 设备 。 地 址 显示 为 二 
进 制 的 或 冒号 十 六 进 制 的 格式 。 第 一 个 格式 
用 来 在 计算 机 中 存储 地 址 ， 第 二 个 格式 是 供 | FEF7:5623:0017:A2B5:BC21:0243:7256:1345 
人 们 使 用 的 。 图 6-30 展示 了 这 两 种 格式 。 冒号 十 六 进 制 (32 位 ) 

如 图 6-31 所 示 ，IPv6 中 的 地 址 事实 上 定 图 6-30 ”IPv6 地 址 表示 
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义 了 三 个 等 级 : 站 点 (组织 )、 子 网 和 到 主机 的 连接 。 


128 位 


全 局 路 由 前 缀 正 网 标识 符 接口 标识 符 











定义 站 点 定义 子 网 - 定义 连接 





到 互联 网 
图 6-31 IPv6 地 址 中 的 分 层 


(2 ) IPv6 数据 报 /IPv4 数据 报 

图 6-32 显示 了 IPv6 数据 报 的 格式 。 在 这 个 版 本 下 的 数据 报 也 是 包括 头 和 有 效 负 荷 ( 数 
据 ) 两 部 分 的 长 度 可 变 的 数据 包 。 头 | 40 字 节 | 多 达 65 535 字 节 | 
的 长 度 是 40 字 节 ， 然 而 ， 在 这 个 版 
本 中 ， 一 些 扩 展 头 有 时 也 被 认为 是 
有 效 负荷 的 一 部 分 。 图 6-32 IPv6 数据 报 


6.5 ”数据 链 路 层 


TCP/IP 协议 族 没 有 定义 数据 链 路 层 中 的 任何 协议 。 这 层 是 网 络 中 连接 起 来 后 可 以 构成 
因特网 的 区 域 。 这 些 网 络 ， 有 线 或 者 无 线 ， 都 接收 服务 并 将 服务 提供 给 网 络 层 。 这 正 可 以 为 
我 们 提供 当今 市 场 上 有 几 种 标准 协议 的 线索 。 

在 前 几 节 中 ， 我 们 学 到 了 在 网 络 层 的 通信 是 主机 间 的 。 然 而 ， 因 特 网 是 通过 连接 设备 
(路 由 器 或 者 开关 ) 胶合 在 一 起 的 网 络 的 组 合体 。 如 果 一 个 数据 报 是 从 一 台 主 机 传输 到 另外 
一 台 主 机 ， 它 需要 通过 这 些 网 络 传递 。 

图 6-33 使 用 了 和 前 三 节 相 同 的 场景 ， 显 示 了 Alice 和 Bob 之 间 的 通信 。 然 而 ， 数 据 链 
路 层 的 通信 由 多 至 5 个 分 开 的 逻辑 连接 组 成 ， 这 些 逻 辑 连 接 在 路 径 中 的 数据 链 路 层 之 间 。 

在 源 和 目标 处 只 包括 一 个 数据 链 路 层 ， 但 在 每 个 路 由 器 处 都 有 两 个 数据 链 路 层 。 造 成 这 
个 的 原因 是 Alice 的 和 Bob 的 计算 机 都 各 自 与 一 个 单独 的 网 络 相连 ， 然 而 每 个 路 由 器 都 从 一 
个 网 络 中 得 到 输入 并 将 输出 发 送 至 另 一 个 网 络 。 


6.5.1 节点 和 链接 


虽然 应 用 层 、 传 输 层 和 网 络 层 的 通信 都 是 端 到 端的 ， 但 数据 链 路 层 的 通信 是 节点 对 节 
点 的 。 网 络 中 一 点 的 数据 单元 需要 穿 过 很 多 网 络 (LAN 和 WAN) 才能 到 达 另 外 一 点 。 这 些 


传输 方向 基本 头 有 效 负荷 
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LAN 和 WAN 都 是 通过 路 由 器 连 在 一 起 的 。 传 统 上 会 将 两 个 端 主机 和 路 由 器 看 作 节 点 ， 它 们 
之 间 的 网 络 看 作 链 接 。 图 6-34 是 当 数据 单元 的 路 径 只 有 6 个 节点 时 链接 和 节点 的 展示 。 


Sky Research 公 司 应 用 层 
因 人 有 
让] 网 络 层 
数据 链 路 层 

s 物理 层 

_ [网络 层 

数据 链 路 层 
到 其 他 ISP www Ee 物理 层 







到 其 他 数据 链 路 层 
物理 层 
R5 
网 络 层 
数据 链 路 层 
物理 层 
本 ISP R7 
图 例 [二 网 络 层 
wm 点 到 点 WAN 
(从 DAN 交换 机 
WAN 交 换 机 a 
>》 路 由 办 应 用 导 
Bob 
注意 : 为 了 简单 ， 我 们 假设 从 源 二 [一 网络 层 
到 目标 只 有 一 条 可 用 路 径 Scientific Books 在 线 书 商 数据 链 耻 导 


图 6-33 ”数据 链 路 层 的 通信 
点 到 点 网 络 


加 点 到 点 网 络 | Te: | | | 央 
LAN LAN 


LAN 
a) 因特网 的 一 小 部 分 





链接 链接 链接 链接 链接 
节点 节点 节点 节点 节点 节点 
b) 节点 和 链接 
6-34 ”节点 和 链接 
连接 节点 的 链接 不 是 LAN 就 是 WAN。 


6.5.2 局 域 网 


在 本 章 的 开头 我 们 就 已 经 知道 了 局 域 网 (LAN) 是 为 有 限 的 地 理 区 域 (如 一 个 建筑 或 校 
园 ) 而 设计 的 计算 机 网 络 。 虽 然 局 域 网 可 以 用 作为 了 共享 资源 的 单一 目的 而 连接 组 织 内 各 计 
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算 机 的 孤立 网 络 ， 但 现在 大 多 数 的 LAN 也 链接 到 广域网 (WAN) 或 因特网 上 。 

局 域 网 可 以 是 有 线 或 无 线 网 络 。 在 第 一 组 ，LAN 中 的 工作 站 之 间 通 过 有 线 连接 ， 第 二 
组 中 的 工作 站 之 间 在 逻辑 上 通过 无 线 连接 。 我 们 将 分 别 讨论 两 组 。 

1. 有 线 LAN: 以 太 网 

虽然 在 过 去 就 已 经 发 明了 几 种 有 线 LAN， 但 只 有 一 种 幸存 了 下 来 一 以 太 网 。 可 能 这 
就 是 以 太 网 根据 因特网 社区 的 需要 升级 了 很 多 次 的 原因 吧 。 

以 太 网 LAN 是 由 罗伯特 ' 梅 特 卡 夫 和 大 卫 ' 博 格 斯 在 20 世纪 70 年 代 开 发 的 。 在 这 之 
后 ， 它 的 发 展 经 历 了 四 代 : 标准 以 太 网 ( 10 Mbps)、 快 速 以 太 网 ( 100 Mbps)、 和 干 兆 以 太 网 
(1 Gbps) 和 万 兆 以 太 网 (10 Gbps)。 数 据 速 率 ， 也 就 是 每 秒 传输 的 位 数 ， 在 每 一 代 都 增加 
了 10 倍 。 

(1 ) 标准 以 太 网 

我 们 把 最 初 数据 速率 为 10 Mbps (每 秒 一 千 万 位 ) 的 以 太 网 技术 认为 是 标准 以 太 网 。 在 
这 种 情况 下 ， 数 据 可 以 从 工作 站 传输 至 LAN 的 速度 被 定义 为 数据 速率 。 在 以 太 网 中 ， 速 度 
是 每 秒 一 千 万 位 。 然 而 ， 这 些 位 不 是 一 个 接着 一 个 发 送 的 ， 每 组 数据 都 被 打包 起 来 并 称 为 
帧 。 帧 中 不 仅 包括 从 发 送 者 到 目标 的 数据 ， 还 带 有 一 些 诸如 源 地 址 (48 位 )、 目 的 地 地 址 
(48 位 )、 数 据 类 型 、 实 际 数据 的 信息 和 一 些 其 他 作为 守卫 来 帮助 检查 传输 中 数据 完整 性 的 控 
制 位 。 如 果 我 们 把 一 帧 看 作 是 一 个 装着 发 信人 寄 给 收 信人 的 信 的 信封 ， 数 据 在 信封 内 ， 而 其 
他 这 些 诸如 地 址 之 类 的 信息 都 在 信封 上 。 在 LAN 中 ,数据 包 都 封装 在 数据 帧 中 。 图 6-35 展 
示 了 一 个 以 太 网 LAN 和 帧 格式 。 


最 小 负荷 长 度 : 46 字 节 
最 大 负荷 长 度 : 1500 字 节 





6 字 节 6 字 节 2 字 节 4 字 节 


最 小 帧 长 度 : 512 位 或 64 字 节 
最 大 帧 长 度 : 12 144 位 或 1518 字 节 





图 6-35 ”以太 网 帧 


(2 ) 快速 以 太 网 ( 100 Mbps) 

20 世纪 90 年 代 ， 以 太 网 通过 把 传输 速率 提升 至 100 Mbps 跨越 了 一 大 步 ， 这 个 新 一 代 
的 以 太 网 被 称 为 快速 以 太 网 。 快 速 以 太 网 的 设计 者 需要 使 快速 以 太 网 能 够 与 标准 以 太 网 竞 
争 ， 所 以 大 部 分 的 协议 像 地 址 、 帧 格式 都 没有 变 。 由 于 传输 速率 的 提高 ， 标 准 以 太 网 的 一 些 
基于 传输 速率 的 特征 需要 重新 修订 。 

(3 ) 千 兆 以 太 网 

对 更 高 的 数据 速率 的 需求 促使 了 千 兆 以 太 网 协议 ( 1000 Mbps) 的 设计 。 万 兆 以 太 网 的 
目标 是 将 数据 速率 升级 至 1 Gbps， 但 是 保持 地 址 长 度 、 帧 格式 以 及 最 大 和 最 小 数据 帧 长 度 
不 变 。 

(4) 万 兆 以 太 网 

近年 来 ， 以 太 网 又 开始 被 考虑 放 在 城市 范围 内 使 用 。 这 个 想法 是 扩展 以 太 网 的 技术 、 数 
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据 速率 和 覆盖 距离 ， 这 样 以 太 网 就 可 以 用 做 LAN 和 MAN ( 城 域 网 )。 设 计 万 兆 以 太 网 的 
目标 可 以 总 结 为 升级 数据 速率 至 10 Gbps， 保 持 数 据 帧 大 小 和 格式 不 变 ， 同 时 允许 LAN、 
MAN 和 WAN 可 能 的 互 连 。 这 个 数据 速率 只 有 此 时 的 光纤 技术 可 以 达到 。 

2. 无 线 LAN 

无 线 通信 是 增长 最 快 的 技术 之 一 。 世 界 各 地 对 无 线 连接 设备 的 需求 都 在 不 断 增 长 。 无 线 
LAN 可 在 大 学 校园 、 办 公 楼 和 其 他 很 多 公共 区 域 找到 。 在 有 线 LAN 和 无 线 LAN 之 间 我 们 
可 以 看 见 的 第 一 个 不 同 之 处 就 是 传输 媒介 。 在 有 线 LAN 中 ， 使 用 电缆 来 连接 主机 。 在 无 线 
LAN 中 ， 传 输 媒 介 是 空气 ， 信 和 号 通常 是 在 空气 中 传播 的 。 当 无 线 LAN 中 的 主机 互相 通信 
时 ， 它 们 在 共享 同样 的 媒介 (多 发 访问 )。 在 这 个 领域 现在 有 两 种 技术 : 无 线 以 太 网 和 蓝牙 。 

(1 ) 无 线 以 太 网 

电气 和 电子 工程 师 协会 (IEEE) 为 无 线 LAN 定义 的 规格 ， 有 时 也 被 称 为 无 线 以 太 网 或 
者 WiFi (wireless fidelity 的 缩写 )。 然 而 ，WiFi 其 实 是 一 个 由 WiFi 联盟 (一 个 拥有 超过 300 
个 成 员 公司 的 国际 非 盈 利 行业 协会 ) 认 
证 的 无 线 LAN。 这 个 标准 定义 了 两 种 ba 
服务 : 基本 服务 集 (BSS) 和 扩展 服务 集 
(ESS)。 第 二 个 服务 使 用 额外 设备 ( 接 人 点 也 小 
或 AP) 作为 连接 其 他 LAN 或 WAN 的 开 





关 。 图 6-36 显示 了 这 两 个 服务 。 种 多 
(2 ) 蓝牙 基本 服务 集 ( BSS ) 扩展 服务 集 ( ESS ) 
蓝牙 是 一 种 无 线 LAN 技术 ， 它 用 于 图 6-36 BSS 和 ESS 


连接 不 同 功 能 的 设备 ， 如 电话 、 笔 记 本 电 
脑 、 计 算 机 (台式 机 以 及 笔记 本 电脑 )、 照 相机 、 打 印 机 ， 甚 至 是 咖啡 机 之 类 的 设备 ， 只 要 
这 些 设备 之 间 的 距离 比较 短 。 蓝 牙 LAN 是 一 个 临时 网 络 ， 这 也 就 意味 这 这 个 网 络 是 自发 的 ， 
这 些 有 时 候 称 为 小 配件 的 设备 互相 连接 之 后 可 以 形成 一 个 叫做 蓝牙 微 网 的 网 络 。 如 果 其 中 一 
个 小 设备 有 连 人 因特网 的 功能 ， 则 蓝牙 LAN 就 可 以 连 人 人 因特网。 蓝牙 LAN 由 于 本 身 特性 
决定 规模 较 小 。 如 果 有 很 多 小 配件 想 要 连 入 蓝牙 LAN 中 ， 通 常会 引起 混乱 。 
蓝牙 技术 有 很 多 应 用 。 无 线 鼠 标 和 无 线 键盘 之 类 的 外 围 设备 可 以 通过 这 个 技术 与 计算 机 
通信 。 在 一 个 小 的 保健 中 心里 ， 监 控 设 备 可 以 通过 这 种 方法 和 感应 设备 通信 。 家 庭 安 全 装置 
可 以 利用 这 个 技术 来 将 不 同 的 传感器 连接 到 主要 的 安全 控制 器 上 。 与 会 者 可 以 在 参与 会 议 时 
同步 他 们 的 笔记 本 电脑 。 
蓝牙 技术 最 初 是 爱立信 公司 开启 的 一 个 项 目 ， 他 的 命名 来 自 于 统一 了 丹麦 和 挪威 的 丹麦 
国王 Harald Blaatand ( 940 一 981 ), 这 里 的 Blaatand 英 译 为 Bluetooth， 也 就 是 蓝牙 。 


6.5.3 ”广域网 


”如 前 所 述 ， 因 特 网 中 连接 两 个 节点 的 可 能 是 LAN 也 可 能 是 WAN。 与 LAN 情况 一 样 ， 
WAN 也 可 以 分 成 有 线 和 无 线 两 类 。 下 面 将 简要 地 分 别 讨论 。 
1. 有 线 WAN 
当今 的 以 太 网 中 有 很 多 种 有 线 WAN， 有 些 是 点 对 点 的 ， 有 些 是 交换 式 WAN。 
(1 ) 点 对 点 无 线 WAN 
现在 我 们 可 以 用 几 种 点 对 点 无 线 网 来 为 连接 到 网 络 的 居民 和 企业 提供 所 谓 的 网 络 未 端 
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服务 。 

(2 ) 拨号 上 网 服务 

拨号 网 络 或 连接 使 用 电话 网 络 提供 的 服务 来 传输 数据 。 电 话 网 络 起 源 于 19 世纪 第 一 个 
十 年 晚期 ， 整 个 网 络 最 初 是 一 个 声音 传输 系统 。 随 着 计算 机 时 代 的 到 来 ， 这 个 网 络 在 20 世 
纪 80 年 代 开 始 在 传输 声音 的 同时 传输 数据 。 在 最 后 一 个 十 年 里 ， 电 话 网 络 经 历 了 很 多 技术 
上 的 改变 。 对 于 数字 化 数据 通信 的 需求 导致 了 拨号 调制 解 调 器 的 发 明 。 

调制 解 调 器 这 个 词 是 一 个 组 合 词 ， 它 指 构成 这 个 设备 的 两 个 功能 性 实体 : 信号 调制 器 和 
信号 解 调 器 。 调 制 器 通过 数据 制造 信号 ， 解 调 器 从 调制 信号 中 恢复 数据 。 图 6-37 显示 了 调 
制 解 调 器 的 思想 。 


| 数字 信号 | 模拟 信号 | 高 速 数 字 信 号 = 
二 一 
调制 解 调 器 。 ”本 地 回环 转换 器 
上 传 : 33.6 kbps 下 载 : 56 kbps 四 
re 


图 6-37 ”提供 因特网 连接 的 拨号 网 络 


(3 ) 数字 用 户 线路 (DSL ) 

在 传统 调制 解 调 器 达到 它们 的 最 高 数据 速率 之 后 ， 电 话 公司 开发 出 了 另 一 种 技术 一 一 
DSL， 来 提供 高 速 网 络 连接 。 数 据 用 户 线路 ( DSL) 技术 是 现 有 的 电话 上 支持 高 速 通 信 中 最 
有 前 途 的 一 种 。DSL 技术 是 一 系列 通过 不 同 的 首 字母 区 分 的 技术 (ADSL、VDSL、HDSL 
和 SDSL)。 这 个 系列 通常 用 xDSL 表示 ， 这 里 的 x 可 以 用 A、V、H 或 S 来 表示 。 我 们 只 讨 
论 ADSL。 这 个 系列 中 的 第 一 个 技术 是 非 对 称 数字 用 户 线路 (ASDL)。ASDL 在 下 游 方 向 (从 
网 络 到 居民 ) 比 在 上 游 方 向 (从 居民 到 网 络 ) 提供 更 快 的 速度 (比特 率 )。 这 也 是 为 什么 它 被 
称 为 非 对 称 的 〈 见 图 6-38 )。 





点 对 点 WAN 


本 地 回环 
ee 电话 网 络 。) ISP 


图 6-38 ASDL 点 对 点 网 络 


ADSL 允许 用 户 同时 使 用 语音 频道 和 数据 频道 。 上 游 速率 可 以 达到 1.44 Mbps。 然 而 ， 
由 于 该 频道 中 的 高 级 别 的 噪音 ， 数 据 速 率 通常 低 于 500 kbps。 下 游 的 数据 速率 可 以 达 
到 13.4 Mbps。 然 而 ， 由 于 该 频道 中 的 噪音 ， 数 据 速率 通常 低 于 8 Mbps。 很 有 意思 的 一 点 
是 ， 这 种 情况 下 电话 公司 充当 ISP， 所 以 电子 邮件 或 网 络 连接 之 类 的 服务 都 由 电话 公司 自身 
提供 。 

(4 ) 有 线 电视 网 络 

有 线 电视 网 络 最 初 是 为 了 那些 由 于 山脉 等 自然 障碍 造成 无 法 接收 数据 的 用 户 提供 电视 
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节目 而 创造 的 。 后 来 有 线 电 视 网 络 在 那些 仅仅 希望 得 到 更 好 的 信号 的 人 中 受到 欢迎 。 除 此 之 
外 ， 有 线 电 视 网 络 使 通过 微波 连接 来 使 用 远程 广播 电台 成 为 可 能 。 有 线 电 视 也 通过 使 用 一 些 
最 初 为 视频 而 设计 的 信道 在 网 络 接 入 规定 中 寻找 到 很 好 的 市 场 。 

电缆 公司 现在 正在 和 电话 公司 竞争 想 要 得 到 高 速 数据 传输 的 住宅 客户 。DSL 技术 越过 本 
地 回环 为 住宅 用 户 提 供 高 数据 速率 的 连接 。 然 而 , DSL 使 用 的 现成 的 非 屏蔽 式 双 绞 线 电缆 很 
容易 受到 干扰 。 这 使 数据 速率 受到 了 上 限 的 限制 。 一 种 解决 策略 就 是 使 用 有 线 电视 网 络 。 本 
节 简 单 讨论 了 这 个 技术 。 图 6-39 展示 了 该 服务 的 一 个 例子 。 


客户 房 拓 中 央 办 公 室 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 > 





图 6-39 有 线 服 务 


(5 ) 交换 式 有 线 WAN 

很 明显 ， 当 今 的 网 络 不 能 只 通过 提供 网 络 末 端 连接 的 点 对 点 有 线 WAN 进行 操作 。 我 们 
需要 交换 式 有 线 WAN 来 连接 网 络 的 骨干 网 。 过 去 为 了 这 个 目的 设计 了 几 个 诸如 SONET 或 
ATM 的 协议 。 然 而 ， 网 络 过 于 复杂 ， 所 以 有 关 它 们 的 讨论 超出 了 本 书 的 范围 。 

2. 无 线 WAN 

如 今 网 络 的 范围 如 此 之 大 ， 以 至 于 有 时 候 仅 通过 有 线 WAN 无 法 向 世界 的 每 一 个 角落 提 
供 服务 。 我 们 必定 需要 无 线 WAN。 下 面 描述 了 出 于 这 个 目的 而 使 用 的 几 种 技术 。 

(1) WiMax 

全 球 互联 接 入 ( WiMax) 是 DSL 或 通过 电缆 连接 因特网 的 无 线 版 ， 它 提供 两 种 服务 ( 固 
定 WiMax) 将 主要 工作 站 与 固定 工作 站 或 移动 电话 之 类 的 移动 工作 站 相连 接 。 图 6-40 展示 
了 这 两 种 连接 。 





BS: 基站 
FSub: 固定 用 户 工 作 站 


图 6-40 WiMax 


(2 ) 手机 网 络 

现今 的 另 一 种 无 线 WAN 是 最 初 为 语音 通信 而 设计 的 手机 电话 ， 现 在 它 也 可 以 用 于 网 络 通 
信 。 如 我 们 所 知 的 那样 ， 蜂 窝 式 网 络 将 地 球 划分 成 单元 。 移 动工 作 站 与 它们 该 时 刻 所 在 的 单 
元 内 的 固定 天 线 通信 。 当 用 户 移动 到 另 一 个 单元 时 ， 通 信 存 在 于 移动 设备 和 新 的 天 线 之 间 。 

(3 ) 卫星 网 络 

卫星 网 络 是 由 节点 组 合 而 成 的 ， 这 些 节点 一 部 分 是 卫星 ， 它 们 提供 地 球 上 一 点 到 另 一 
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点 的 通信 。 网 络 中 的 一 个 节点 可 以 是 一 个 卫星 、 一 个 地 球 工作 站 或 者 一 个 最 终 用 户 终端 或 
电话 。 

卫星 网 络 很 像 蜂 窒 式 网 络 ， 因 为 它 将 整个 星球 划分 成 了 单元 。 卫 星 可 以 提供 往返 于 地 球 
上 无 论 多 远 的 任意 地 点 处 的 传输 功能 。 这 个 优势 使 得 高 品质 的 通信 可 以 提供 给 世界 上 的 落后 
地 区 ， 却 不 需要 在 地 面 基础 设施 上 进行 巨大 投资 。 


6.6 ”物理 层 


如 果 不 讨论 物理 层 ， 关 于 TCP/IP 协议 族 的 讨论 就 是 不 完整 的 。 物 理 层 的 角色 是 将 从 数 
据 链 路 层 接收 的 位 转换 成 用 于 传输 的 电磁 信号 。 当 位 被 转换 成 信号 后 ， 信 和 号 将 被 传送 至 传输 
媒介 ， 这 也 就 是 下 一 节 讨 论 的 主题 。 图 6-41 使 用 了 和 前 面 4 节 相 同 的 场景 ， 但 是 现在 的 通 
信和 是 在 物理 层 。 


Sky Research 公 司 


到 其 他 ISP wl € 










到 其 他 器 数据 链 路 层 
ISP 物理 层 
R5 
[jj 网 络 层 
加 [数据 链 路 层 
物理 层 
ISP R7 
i 弓 汪 网 络 屋 
DID 数据 链 路 层 
Te 点 对 点 WAN 物理 层 
从 LAN 交换 机 
WAN 交 换 机 Bob 
Le | 应 用 层 
路 由 器 妆 全 
= ee 网 络 层 
注意 : 为 了 简单 ， 我 们 假设 从 源 
到 目标 只 有 一 条 可 用 路 径 Scientific Books 在 线 书 商 | i 


图 6-41 物理 层 通 信 


6.6.1 数据 和 信号 
在 物理 层 的 通信 和 是 节点 对 节点 的 ,但 是 节点 交换 的 是 电磁 信号 。 
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物理 层 的 一 个 主要 功能 就 是 为 位 确定 在 节点 间 传 输 的 路 线 。 但 是 就 像 它 代表 的 是 节点 
(主机 、 路 由 器 或 交换 机 ) 内 存 中 储存 的 两 个 可 能 的 值 一 样 ， 位 不 能 直接 发 送 到 传输 媒介 (有 
线 或 无 线 ) ; 这 些 位 在 传输 之 前 需要 先 转换 成 信号 。 所 以 物理 层 的 主要 责任 是 高 效 地 将 这 些 
位 转换 成 电磁 信号 。 我 们 首先 需要 理解 数据 的 本 质 和 信号 的 种 类 才能 明白 我 们 如 何 才能 有 效 
地 进行 这 种 转换 。 

模拟 的 和 数字 的 

数据 可 以 有 两 种 形式 ， 模 拟 的 和 数字 的 。 模 拟 数据 这 个 词 指 连 续 的 信息 。 模 拟 数据 ， 比 
如 人 发 出 的 声音 ， 呈 现 的 是 连续 的 值 。 当 一 个 人 说 话 时 ， 空 气 中 就 出 现 了 一 个 模拟 波 。 这 个 
模拟 波 可 以 通过 麦克 风 捕 捉 并 转换 成 模拟 信号 或 者 采样 并 转换 成 数字 信和 号。 

数字 数据 呈现 的 是 离散 的 值 。 例 如 ， 数 据 在 计算 机 内 存 中 是 以 0 和 1 的 形式 存储 的 。 它 
们 可 以 转换 成 数字 信号 或 者 调制 成 用 来 通过 媒介 进行 传输 的 模拟 信号 。 

就 像 它们 所 代表 的 数据 一 样 ， 信 号 也 可 以 是 模拟 的 或 数字 的 。 模 拟 信号 在 一 个 时 间 段 
中 有 无 限 种 不 同 的 等 级 强度 ， 就 像 当 波 从 A 值 移动 到 B 值 的 时 候 ， 它 的 路 径 经 过 并 包括 无 
限 个 值 。 与 之 不 同 的 是 ， 数 字 信 号 可 以 只 拥有 有 限 个 定义 的 值 。 虽然 每 个 值 可 以 是 任意 数 
字 ， 通常 它们 都 像 1 和 0 这 么 简单 。 展 示 信 和 号 最 简单 的 方法 是 将 它们 绘制 在 一 组 相互 垂直 的 
轴 上 。 纵 轴 代 表 信 号 的 值 或 强度 ， 横 轴 代 表 时 间 。 图 6-42 绘制 了 一 个 模拟 信号 和 一 个 数字 





信号 。 
值 值 
AAN 时 间 ED 
a) 模拟 信号 b) 数字 信号 
图 6-42 ”模拟 信号 和 数字 信号 的 对 比 
6.6.2 ”数字 化 传输 


计算 机 网 络 是 为 将 信息 从 一 点 发 送 到 另 一 点 而 设计 的 。 这 个 信息 需要 转换 成 数字 信和 号 或 
模拟 信和 号 来 进行 传输 。 如 果 这 个 数据 是 数据 化 的 ， 需 要 用 数 数 转换 技术 ， 一 种 将 数字 数据 转 
换 成 数字 信和 号 的 方法 。 如 果 数 据 是 模拟 的 ， 需 要 使 用 模 数 转 换 技 术 ， 一 个 将 模拟 信号 转换 成 
数字 信号 的 方法 。 

1. 数 数 转 换 

如 果 数 据 是 数字 化 的 并 且 需 要 传输 数字 信号 ， 可 以 使 用 数字 到 数字 的 转换 ， 将 数字 数据 
转换 成 数字 信号 。 虽 然 有 很 多 技术 可 以 达到 这 个 目的 ， 当 数据 处 于 最 简单 的 一 位 或 一 组 位 的 
形式 时 ， 这 个 数据 如 图 6-43 所 示 用 一 个 信号 电 平 表示 。 


数字 数据 数字 数据 


0101…101 









发 送 方 接收 方 
图 6-43” 数 数 转 换 
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2. 模 数 转换 

有 时 候 我 们 通过 麦克 风 或 照相 机 得 到 一 个 模拟 信号 ， 现 在 的 趋向 是 将 模拟 信号 转换 成 数 
字数 据 ， 因 为 数字 信和 号 受到 噪音 干扰 的 影响 更 小 。 虽 然 有 很 多 种 技术 可 以 达到 这 个 目的 ， 最 
简单 的 方法 是 对 模拟 信号 取样 来 生成 一 个 数字 化 数据 ， 再 像 前 面 讨论 过 的 一 样 将 数字 数据 转 
换 成 数字 信和 号， 如 图 6-44 所 示 。 











En 连接 和 过 滤 


[0o101-…101| | 数字 信号 。 数字 数据 | 0101…101| 
链接 接收 方 
图 6-44 ” 模 数 转换 





6.6.3 ”模拟 传输 


虽然 数字 化 传输 是 令 人 满意 的 ， 但 它 需 要 一 个 专用 通道 。 模 拟 传输 是 当 我 们 没有 专用 通 
道 时 的 唯一 选择 。 例 如 ， 当 我 们 在 空气 中 进行 传播 时 ， 空 气 属 于 所 有 人 ， 而 我 们 只 能 使 用 频 
道中 可 用 的 那 一 部 分 。 基 于 可 用 的 数据 类 型 ， 我 们 可 以 用 数 模 转 换 或 模 模 转换 。 

1. 数 模 转 换 

数 模 转换 是 基于 数字 数据 的 信息 改变 模拟 信和 号 的 某 个 特征 的 过 程 。 图 6-45 展示 了 数字 
信息 、 数 模 转换 过 程 和 最 终 得 到 的 模拟 信和 号 。 


数字 数据 模拟 信号 数字 数据 





发 送 方 和 接收 方 


图 6-45 ” 数 模 转换 


2. 模 模 转换 
模 模 转 换 是 基于 模拟 数据 的 信息 改变 模拟 信号 的 某 个 特征 的 过 程 。 图 6-46 展示 了 模拟 
信息 、 模 模 转 换 过 程 和 最 终 得 到 的 模拟 信号 。 


模拟 信号 模拟 信号 模拟 信号 





链接 
图 6-46 ” 模 模 转换 
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6.7 ”传输 介质 


在 物理 层 产生 的 电子 信号 需要 传输 介质 来 从 一 端 传输 到 另 一 端 。 传 输 介质 通常 在 物理 层 
之 下 , 并且 受到 物理 层 的 直接 控制 。 我 们 可 以 说 传输 介质 属于 第 0 层 。 图 6-47 展示 了 传输 
介质 相对 于 物理 层 的 位 置 。 





电缆 或 空气 
图 6-47 传输 介质 和 物理 层 


传输 介质 可 以 大 致 定义 为 任何 可 以 将 信息 从 源 传输 到 目标 的 介质 。 例 如 ， 两 个 一 边 用 和 餐 
一 边 交谈 的 人 的 传输 介质 就 是 空气 。 空 气 可 以 把 信息 转换 成 烟雾 信号 或 信号 量 。 对 于 书信 来 
说 ， 传 输 介 质 就 可 能 是 邮 车 、 卡 车 ， 甚 至 是 飞机 。 

在 电信 中 ， 传 输 介质 可 以 分 为 两 大 类 : 导向 介质 和 无 导向 介质 。 导 向 介质 包括 双 绞 线 、 
同 轴 电 缆 和 光纤 。 无 导向 介质 是 自由 空间 。 


6.7.1 导向 介质 


导向 介质 就 是 那些 用 来 提供 从 一 个 设备 到 另 一 个 设备 的 通道 的 ， 包 括 双 绞 线 、 同 轴 电 缆 
和 光纤 电缆 。 图 6-48 展示 了 三 种 导向 介质 。 


塑料 护 套 
塑料 护 套 





外 部 导体 


b) 同 轴 电 缆 







c) 光纤 电缆 
图 6-48 ”导向 介质 

1. 双 绞 线 

双 绞 线 包 括 两 根 绞 在 一 起 的 导线 (通常 是 铜 线 )， 这 两 根 导线 是 分 别 包 着 塑料 绝缘 的 。 
双 绞 线 中 一 根 的 作用 是 将 信和 号 传送 到 接收 方 ， 另 一 根 的 作用 仅仅 是 接地 参考 。 接 收 方 使 用 两 
者 的 不 同 。 

除了 来 自发 送 方 的 信号 以 外 , 干涉 (噪音 ) 也 会 影响 两 根 线 并 制造 出 多 余 信 和 号。 如果 两 
根 线 是 平行 的 ， 那 么 这 些 多 余 信 和 号 在 两 根 线 上 的 影响 是 不 一 样 的 ， 因 为 它们 相对 于 噪音 源 处 
于 不 同 的 位 置 。 通 过 将 两 根 线 绞 在 一 起 ， 平 衡 就 得 到 了 保持 。 
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电话 公司 用 于 提供 高 数据 率 链接 的 DSL 线路 也 是 双 绞 线 。 

2. 同 轴 电 缆 

同 轴 电 缆 有 一 个 位 于 中 心 且 密封 在 绝缘 外 壳 中 的 实心 (通常 是 铜 导线 ) 或 绞 合 线 作 为 核 
心 导线 ， 同 时 这 个 导线 也 依次 密封 在 金属 箱 或 金属 网 或 二 者 构成 的 外 金属 包装 和 绝缘 护 套 
中 ， 而 不 是 使 用 两 根 线 。 这 里 的 外 层 金属 包装 既 用 作 抗 噪音 的 屏蔽 也 作为 补 全 电路 的 第 二 导 
体 使 用 。 整 个 电缆 由 塑料 护 套 保护 。 

有 线 电 视 网 络 使 用 的 是 同 轴 电 缆 。 传 统 的 有 线 电视 网 络 中 ， 整 个 网 络 由 同 轴 电 缆 构成 。 
然而 ， 后 来 有 线 电视 供应 商 把 大 多 数 的 媒介 换 成 了 光纤 电缆 ， 混 合 网 络 也 只 在 网 络 的 边缘 和 
靠近 顾客 房屋 处 使 用 同 轴 电缆 。 

3. 光纤 电缆 

光纤 电缆 由 玻璃 或 塑料 构成 ， 它 以 光 的 形式 传递 信号 。 这 种 技术 使 用 一 东 光 在 进入 密度 
较 低 介质 时 既 不 反射 也 不 折射 的 特性 。 在 玻璃 或 塑料 介质 外 覆盖 另 一 种 密度 较 小 的 介质 ( 称 
为 包 层 ) 来 导 引 光 通 过 媒介 。 

光纤 电缆 通常 在 骨干 网 中 找到 ， 因 为 它 的 高 带宽 具有 成 本 效益 。 


6.7.2” 非 导向 介质 : 无 线 


非 导 向 介质 不 通过 物理 上 的 导体 来 传播 电磁 波 。 这 种 通信 通常 归 为 无 线 通信 。 信 和 号 通常 
在 自由 空间 中 传播 ， 这 样 任何 有 能 够 接收 信号 的 设备 的 人 都 可 以 使 用 它 。 
图 6-49 展示 了 电磁 波谱 中 用 于 无 线 通 信 的 波段 ， 从 3 kHz 到 900 THz。 





3 300 
kHz GHz THz THz 


图 6-49 用 于 无 线 通 信 的 电磁 波 频谱 


现在 用 三 种 不 同 范 围 的 电磁 波 频谱 来 进行 通信 : 无 线 电波 、 微 波 和 红外 波 。 

1. 无 线 电波 

频率 在 3 kHz ~ 1 GHz 之 间 的 电磁 波 通常 叫做 无 线 电波 。 它 们 通常 用 于 无 线 电 通 信 。 

2. 微波 

频率 在 1 一 300 GHz 的 电磁 波 叫 做 微波 。 微 波 是 没有 方向 性 的 。 当 天 线 传输 微波 时 ， 
它们 可 以 集中 得 很 窗 ， 也 就 是 说 发 送 和 接收 微波 的 天 线 需 要 对 齐 。 微 波 没 有 方向 性 的 一 个 最 
明显 的 优势 就 是 一 对 天 线 可 以 在 不 和 另 一 对 天 线 相互 干 扰 的 情况 下 对 齐 。 

3. 红外 波 

红外 波 ， 频 率 在 300 GHz ~ 400 THz 之 间 (波长 在 770 nm ~ 1 mm 之 间 )， 它 可 以 用 于 
短程 通信 。 红 外 波 的 频率 较 高 ， 无 法 穿 透 墙壁 ， 这 个 有 着 明显 优势 的 特点 防止 了 不 同系 统 之 
间 的 干扰 ， 一 个 房间 内 的 短程 通信 系统 不 会 受到 下 一 个 房间 内 的 另 一 个 系统 的 影响 。 当 使 用 
红外 遥控 器 时 ， 不 会 受到 邻居 使 用 遥控 器 的 干扰 。 但 是 同样 的 特征 使 红外 信号 对 于 长 距离 通 
信 而 言 是 无 用 的 。 另 外 ,我们 不 能 在 室外 使 用 红外 波 ， 因 为 太阳 光 中 的 红外 波 会 对 通信 产生 
干扰 。 
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6.8 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 


小 结 


Forouzan, B. and Mosharrf F. computer Networks: A Top-Down Approach, New York: 
McGraw-Hill College, 2006 

Forouzan, B. Data Communication and Networking, New York: McGraw-Hill College, 
2013 | 
Forouzan, B. TCP/IP Protocol Suite, New York: McGraw-Hill, 2007 

Forouzan, B. Local Area Networks, New York: McGraw-Hill Higher Education, 2003 
Kurose, J. and Ross, K. Computer Networking, Reading, MA: Addison Wesley, 2007 


网 络 是 通过 通信 链接 连接 的 一 组 设备 。 现 今 ， 当 提起 网 络 时 ， 我 们 通常 指 的 两 种 基 
本 类 型 的 网 络 : LAN 和 WAN。 当 今 网 络 由 连接 设备 和 交换 站 连接 的 很 多 局 域 网 和 
广域网 构成 。 协 议 是 一 组 控制 通信 的 规则 。TCP/IP 是 一 个 由 5 层 构成 的 分 级 协议 族 . 
这 5 层 分 别 为 : 应 用 层 、 传 输 层 、 网 络 层 、 数 据 链 路 层 和 物理 层 。 

网 络 中 的 应 用 使 用 客户 机 - 服务 器 模式 或 端 到 端 模 式 二 者 之 一 。 万 维 网 (WWW) 是 
一 个 由 世界 各 地 的 链接 构成 的 存储 库 。 用 来 得 到 万 维 网 上 的 数据 的 主要 协议 是 超 文 
本 传输 协议 (HTTP)。 文 件 传 输 协 议 (FTP) 是 TCP/IP 协议 族 客户 机 - 服务 器 应 用 ， 
它 的 作用 是 从 一 台 计 算 机 复制 文件 到 另 一 台 计 算 机 。 电 子 邮 件 是 最 流行 的 因特网 应 
用 之 一 。TELNET 是 允许 用 户 访问 远程 计算 机 的 客户 机 - 服务 器 应 用 程序 ， 使 用 户 
能 访问 远程 系统 。 

域名 系统 (DNS) 是 在 网 络 上 使 用 唯一 名 称 标识 每 一 台 主 机 的 客户 机 - 服务 器 应 用 程序 。 
传输 层 协议 的 主要 责任 是 提供 进程 到 进程 的 通信 。UDP 是 提供 不 可 靠 、 无 连接 服 
务 的 传输 协议 。 传 输 控 制 协议 (TCP) 是 另 一 个 提供 面向 连接 的 可 靠 服务 的 传输 层 
协议 。 

网 络 层 负 责 监 督 底 层 物理 网 络 对 数据 包 的 处 理 。IPv4 是 负责 源 至 目标 传递 的 一 个 不 
可 靠 的 无 连接 协议 。 在 TCP/IP 协议 族 的 IP 层 使 用 的 标识 符 叫 做 IP 地 址 。IPv4 地 址 
的 长 度 是 32 位 ， 网 际 协议 的 最 新 版 本 IPv6 有 128 位 的 地 址 空间 。 

数据 链 路 层 涉 及 局 域 网 和 广域网 (LAN 和 WAN)。LAN 和 WAN 可 以 是 有 线 的 也 可 
以 是 无 线 的 。 以 太 网 是 使 用 范围 最 广 的 有 线 局 域 网 协议 。 拨 号 上 网 服务 、DSL 和 有 
线 网 络 大 都 使 用 点 对 点 有 线 WAN。 无 线 WAN 由 无 线 以 太 网 组 成 。 蓝 牙 是 一 种 用 来 
连接 小 范围 内 设备 (叫做 小 配件 ) 的 无 线 LAN 技术 。WiMAX 是 一 个 未 来 可 用 于 代 
替 DSL 和 电缆 的 无 线 接 人 网 络 。 

数据 必须 先 转换 成 电磁 信和 号 才能 传输 。 模 拟 数据 是 连续 的 并 使 用 连续 的 值 ， 数 字数 
据 有 离散 的 状态 并 取 离 散 的 值 。 数 数 转换 将 数字 数据 转换 成 数字 信和 号， 数 模 转 换 是 
将 数字 数据 转换 成 模拟 信号 的 过 程 。 模 数 转换 是 对 模拟 数据 进行 取样 并 转换 成 数字 
信号 的 过 程 。 模 模 转换 指 将 模拟 数据 转换 成 模拟 信号 。 

传输 介质 在 物理 层 之 下 。 导 向 介质 为 设备 之 间 提 供 物 理 通道 。 双 绞 线 、 同 轴 电 缆 、 
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光纤 电缆 是 现在 最 流行 的 导向 介质 。 非 导向 介质 (自由 空间 ) 在 不 使 用 物理 导体 的 前 
提 下 传输 电磁 波 。 


6.9 练习 
小 测验 
在 本 书 网 站 上 提供 一 套 与 本 章 相 关 的 交互 式 测验 题 。 强 烈 建议 学 生 在 做 本 章 练习 前 首先 
完成 相关 测验 题 以 检测 对 本 章 内 容 的 理解 。 
复习 题 


1. 本 章 讨论 的 需要 遵循 达成 双向 通信 的 协议 分 层 首要 原则 是 什么 ? 
2. 在 TCP/IP 协议 族 中 ， 当 我 们 考虑 应 用 层 的 逻辑 连接 时 ， 发 送 方 和 接收 方 网 站 的 相同 对 象 是 什么 ? 
3. 使 用 TCP/IP 协议 族 的 一 台 主 机 和 另 一 台 主 机 通信 时 ， 在 以 下 各 层 中 发 送 或 接收 的 数据 单元 分 别 是 


什么 ? 
a. 应 用 层 b. 网 络 层 c. 数据 链 路 层 
4. 下 列 哪个 数据 单元 以 帧 来 封装 ? 
a. 用 户 数 据 报 b. 数据 报 c. 段 
5. 下 列 哪个 数据 单元 从 用 户 数据 报 解 封 ? 
a. 数据 报 b. 段 c. 消息 
6. 下 列 哪个 数据 单元 有 应 用 层 的 消息 加 上 第 4 层 的 头 ? 
a. 帧 b. 用 户 数 据 报 c. 位 
7. 在 以 下 各 层 中 各 使 用 何 种 地 址 (标识 符 ) 类 型 ? 
a. 应 用 层 b. 网 络 层 c. 数据 链 路 层 


8. 在 周末 ，Alice 经 常 要 通过 她 的 笔记 本 电脑 访问 保存 在 办 公 室 台式 机 上 的 文件 。 上 周 她 在 办 公 室 台式 
机 上 安装 了 一 个 FTP 服务 器 程序 的 副本 ， 在 家 里 的 笔记 本 电脑 上 安装 了 FTP 客户 机 程序 的 副本 。 她 
很 失望 周末 无 法 访问 到 她 的 文件 。 这 可 能 出 现 什 么 差错 了 ? 

9. 大 多 数 安装 在 个 人 计算 机 上 的 操作 系统 带 有 有 几 个 客户 端 进程 ， 但 通常 没有 服务 器 进程 ， 请 解释 原因 。 

10. 新 的 应 用 程序 将 会 使 用 客户 端 机 - 服务 器 模式 设计 。 如 果 仅 有 少量 消息 需要 在 客户 机 和 服务 器 之 间 
交换 ， 且 不 用 担心 消息 丢失 或 损坏 ， 你 推荐 哪 种 传输 层 协议 呢 ? 

11. 为 什么 网 络 层 的 职责 是 路 由 ? 换言之 ， 为 什么 路 由 不 能 在 传输 层 或 数据 链 路 层 实 现 ? 

12. 请 区 分 网 络 层 的 通信 和 数据 链 路 层 的 通信 。 

13. 什么 是 拨号 调制 解 调 器 技术 ? 列 出 本 章 讨 论 过 的 通用 调制 解 调 器 标准 ， 给 出 它们 的 数据 速率 。 

14. 为 什么 蓝牙 通常 被 称 为 无 线 个 人 域 网 (WPAN)， 而 不 是 无 线 局 域 网 ? 

15. 当 频 率 给 定时 ， 如 何 求 正弦 波 的 周期 ? 

16. 以 下 哪个 物理 量 用 于 度量 信号 的 值 ? 

a. 振幅 b. 频率 c. 相位 

17. 定义 模拟 传输 。 

18. 在 TCP/IP 协议 族 中 ， 传 输 介质 在 什么 位 置 ? 

19. 指出 传输 介质 两 大 类 别 的 名 称 。 

20. 导向 介质 的 三 大 类 别 是 什么 ? 


练习 题 
1. 回答 以 下 有 关 图 6-5 所 示 从 Maria 到 Ann 通信 时 的 问题 : 
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a. 在 Maria 的 站 点 ， 由 1 层 到 2 层 提 供 了 什么 服务 ? 
b. 在 Ann 的 站 点 ， 由 1 层 到 2 层 提供 了 什么 服务 ? 
2. 回答 以 下 有 关 图 6-5 所 示 从 Maria 到 Ann 通信 时 的 问题 : 
a. 在 Maria 的 站 点 ， 由 2 层 到 3 层 提 供 了 什么 服务 ? 
b. 在 Ann 的 站 点 ， 由 2 层 到 3 层 提 供 了 什么 服务 ? 

3. 假设 连接 到 因特网 的 主机 在 2010 年 是 5 亿 台 。 这 个 数字 以 每 年 20% 的 速度 增长 ， 到 2020 年 主机 数 
量 是 多 少 ? 

4. 假设 系统 使 用 5 个 协议 层 。 如 果 应 用 程序 创建 了 一 个 100 字 节 的 消息 ， 并 且 每 层 (包括 第 1 层 和 第 
5 层 ) 添加 一 个 10 字 节 的 报头 到 数据 单元 中 ， 该 系统 的 效率 (应 用 层 的 位 数 相 对 于 要 传输 的 位 数 速 
率 ) 如 何 ? 

5. 与 下 列 TCP/IP 协议 族 一 或 多 层 相 匹 配 的 是 : 


a. 线路 的 确定 b. 连接 到 传输 介质 c. 为 最 终 用 户 提供 服务 
6. 与 下 列 TCP/IP 协议 族 一 或 多 层 相 匹配 的 是 : 
a. 创建 用 户 报 b. 负责 处 理 毗 邻 节 点 间 的 帧 c. 把 数位 转换 为 电磁 信号 


7. 在 我 们 生活 的 很 多 方面 能 发 现 协议 分 层 ， 例 如 航空 旅行 。 设 想 你 假期 要 去 度假 胜地 旅行 。 在 当地 机 
场 起 飞 之 前 你 需要 办 些 手续 ， 到 度假 胜地 机 场 落地 后 也 需要 办 些 手 续 。 请 指出 用 于 往返 旅行 的 协议 
分 层 ， 使 用 诸如 : 行李 检查 /认领 、 登 机 /出 机 、 起 飞 /降落 。 

8. 在 因特网 中 ， 我 们 把 局 域 网 技术 更 新 了 。TCP/IP 协议 族 哪些 层 需 要 变更 ? 

9. 比较 16 位 耳 地 址 (0 一 65 535) 和 32 位 IP 地 址 (0 ~ 4 294 967 295 ) 的 范围 ,为 什么 我 们 需要 
IP 地 址 有 如 此 大 的 范围 ， 但 端口 号 却 相对 范围 小 呢 ? 

10. 使 用 二 进 制 表示 法 ， 重 写 以 下 地 址 : 


a. 110.11.5.88 b. 12.74.16.18 c. 201.24.44.32 
11. 使 用 十 进 制 点 表示 法 ， 重 写 以 下 IP 地 址 : 


a. 01011110 10110000 01110101 00010101 b. 10001001 10001110 11010000 00110001 
c. 01010111 10000100 00110111 00001111 
12. 下 列 以 太 网 地 址 等 价 的 十 六 进 制 形式 是 什么 ? 
01011010 00010001 01010101 00011000 10101010 00001111 
13. 一 个 设备 以 1000 bps 的 速率 发 送 数 据 。 | 
a. 发 送 10 位 用 多 长 时 间 ? b. 发 送 一 个 字符 (8 位 ) 用 多 长 时 间 ? 
c. 发 送 100 000 个 字符 的 文件 用 多 长 时 间 ? 


小 程序 


我 们 创建 了 一 些 Java 小 程序 来 演示 本 章 中 的 一 些 主要 概念 。 强 烈 建议 学 生 通过 激活 这 
些 放 在 本 书 网 站 上 的 小 程序 ， 并 在 行动 中 仔细 检测 书 中 讲 的 那些 协议 。 
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操作 系统 





这 是 本 书 讨论 计算 机 软件 的 第 一 章 。 在 本 章 中 ,我 们 将 展示 操作 系统 在 计算 机 中 的 
作用 。 
目标 
通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 
e 理解 操作 系统 在 计算 机 中 的 作用 ; 
给 出 操作 系统 的 定义 ; 
理解 把 操作 系统 调 人 内存 的 自 举 过 程 ; 
列 出 操作 系统 的 组 成 部 分 ; 
讨论 操作 系统 中 内 存 管 理 器 的 作用 ; 
讨论 操作 系统 中 进程 管理 器 的 作用 ; 
讨论 操作 系统 中 设备 管理 器 的 作用 ; 
讨论 操作 系统 中 文件 管理 器 的 作用 ; 
理解 三 种 常见 操作 系统 的 主要 特点 ， UNIX、Linux 和 Windows NT。 


7.1 引言 


计算 机 系统 是 由 两 个 主要 部 分 组 成 的 : 硬件 和 软件 。 
硬件 是 计算 机 的 物理 设备 。 软 件 则 是 使 得 硬件 能 够 正常 工 
作 的 程序 的 集合 。 计 算 机 软件 分 成 两 大 类 : 操作 系统 和 应 





计算 机 系统 


用 程序 (图 7-1 )。 应 用 程序 使 用 计算 机 硬件 来 解决 用 户 的 
问题 。 另 一 方面 ， 操 作 系统 则 控制 计算 机 系统 用 户 对 硬件 a 应 用 程序 
的 访问 。 图 7-1 计算 机 系统 

7.1.1 操作 系统 


操作 系统 是 一 个 非常 复杂 的 系统 ， 因 此 很 难 给 予 它 一 个 普遍 认同 的 简单 定义 。 在 这 里 例 
举 一 些 常见 的 定义 : 
。 操作 系统 是 介 于 计算 机 硬件 和 用 户 (程序 或 人 ) 之 间 的 接口 。 
。 操作 系统 是 一 种 用 来 使 得 其 他 程序 更 加 方便 有 效 运行 的 程序 (或 程序 集 )。 
。 操作 系统 作为 通用 管理 程序 管理 着 计算 机 系统 中 每 个 部 件 的 活动 ， 并 确保 计算 机 系 
统 中 的 硬件 和 软件 资源 能 够 更 加 有 效 地 使 用 。 当 出 现 资源 使 用 冲突 时 ， 操 作 系统 应 
能 够 及 时 处 理 ， 排 除 冲 突 。 
操作 系统 是 


操作 系统 的 两 个 主要 设计 目标 
。 有 效 地 使 用 硬件 。 
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。 容易 地 使 用 资源 。 
7.1.2 自 举 过 程 


基于 上 面 的 定义 ， 操 作 系统 为 其 他 程序 提供 支持 。 例 如 ， 它 负责 把 其 他 程序 装 人 内 存 ， 
以 便 运 行 。 但 是 ， 操 作 系 统 本 身 也 是 程序 ， 它 需要 被 装 人 内 存 和 运行 ， 这 个 困境 如 何 解决 
呢 ? 如 果 使 用 ROM 技术 把 操作 系统 存储 (由 制造 商 完成 ) 在 内 存 中 ， 这 个 问题 就 能 解决 。 
CPU (参见 第 5 章 ) 的 程序 计数 器 可 以 被 设置 为 这 个 ROM 的 开始 处 。 当 计算 机 被 加 电 时 ， 
CPU 从 ROM 中 读 取 指 令 ， 执 行 它们 。 但 这 种 解决 方案 是 非常 低 效 的 ， 因 为 内 存 的 很 大 一 部 
分 需要 由 ROM 构成 ， 而 不 能 被 其 他 程序 使 用 。 如 今 的 技术 是 仅 需要 分 配 小 部 分 的 内 存 给 部 
分 操作 系统 。 

如 今 使 用 的 解决 方案 采用 两 阶段 过 程 。 很 小 一 部 分 内 存 用 ROM 构成 ， 其 中 存 有 称 为 自 
举 程序 的 小 程序 。 当 计算 机 被 加 电 时 ，CPU 计数 器 被 设置 为 自 举 程序 的 第 一 条 指令 ， 并 执 
行程 序 中 的 指令 。 这 个 程序 唯一 的 职责 就 是 把 操作 系统 本 身 (需要 启动 计算 机 的 那 部 分 ) 装 
人 RAM 内 存 。 当 装 人 完成 后 ，CPU 中 的 程序 计数 器 就 被 设置 为 RAM 中 操作 系统 的 第 一 条 
指令 ， 操 作 系统 就 被 执行 。 图 7-2 说 明了 自 举 过 程 。 

ROM 


9 __ 巴 下 
下 


操作 系统 as CPU 


自 举 程序 







磁盘 


1. 自 举 程序 运行 
2. 操 作 系统 被 装 人 
3. 操 作 系 统 运 行 内 存 
图 7-2 自 举 过 程 
7.2 演化 
操作 系统 已 经 经 历 了 很 长 的 一 段 发 展 历程 ， 我 们 将 在 下 面 加 以 总 结 。 
7.2.1 批 处理 系 统 


批 处 理 操作 系统 设计 于 20 世纪 50 年 代 ， 目 的 是 控制 大 型 计算 机 。 当 时 计算 机 十 分 庞 
大 。 用 穿孔 卡片 进行 输入 数据 ， 用 行 式 打印 机 输出 结果 ， 用 磁带 设备 作为 辅助 存储 介质 。 

每 个 运行 的 程序 叫做 一 个 作业 。 想 要 运行 程序 的 程序 员 通过 穿孔 卡片 将 程序 和 数据 输入 
计算 机 ， 并 向 控制 器 发 出 作业 请 求 。 穿 孔 卡片 由 操作 员 处 理 。 如 果 程 序 运行 成 功 ， 打 印 结果 
将 传 给 程序 员 ， 如 果 不 成 功 ， 则 报错 。 

这 个 时 代 的 操作 系统 非常 简单 : 它们 只 保证 计算 机 所 有 资源 被 从 一 个 作业 转换 到 另 一 个 
作业 。 


7.2.2 ”分 时 系统 


为 了 有 效 使 用 计算 机 资源 ， 多 道 程序 的 概念 被 引入 。 它 可 以 将 多 个 作业 同时 装 人 内 存 ， 
并 且 仅 当 该 资源 可 用 时 分 配给 需要 它 的 作业 。 例 如 ， 当 一 个 程序 正 使 用 输入 /输出 设备 时 ， 
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CPU 则 处 于 空闲 状态 ， 并 可 以 供 其 他 程序 使 用 。 我 们 将 在 本 章 后 面 详细 介绍 多 道 程序 。 

多 道 程序 带 来 了 分 时 的 概念 : 资源 可 以 被 不 同 的 作业 分 享 。 每 个 作业 可 以 分 到 一 段 时 间 
来 使 用 资源 。 因 为 计算 机 运行 速度 很 快 ， 所 以 分 时 系统 对 于 用 户 是 隐藏 的 ， 每 个 用 户 都 感觉 
整个 系统 在 为 自己 服务 。 

最 终 利 用 分 时 技术 的 多 道 程 序 极 大 地 改进 了 计算 机 的 使 用 效率 。 但 是 ， 它 们 需要 有 一 个 
更 加 复杂 的 操作 系统 ， 它 必须 可 以 调度 : 给 不 同 的 程序 分 配 资源 并 决定 哪 一 个 程序 什么 时 候 
使 用 哪 一 种 资源 。 在 这 个 时 代 中 用 户 和 计算 机 的 关系 也 改变 了 。 用 户 可 以 直接 与 系统 进行 交 
互 而 不 必 通 过 操作 员 。 一 个 新 的 术语 也 随 之 产生 : 进程 。 一 个 作业 是 一 个 要 运行 的 程序 ， 一 
个 进程 则 是 在 内 存 中 等 待 分 配 资源 的 程序 。 


7.2.3 个 人 系统 


当 个 人 计算 机 产生 后 ， 需 要 有 一 类 适合 这 类 计算 机 的 操作 系统 。 于 是 ， 单 用 户 操 作 系 统 
就 应 运动 而 生 了 ， 如 DOS (磁盘 操作 系统 )。 


7.2.4 ”并 行 系统 


人 们 对 更 快 和 更 有 效 的 需求 导致 了 并 行 系统 的 设计 : 在 同一 计算 机 中 安装 了 多 个 CPU， 
每 个 CPU 可 以 处 理 一 个 程序 或 者 一 个 程序 的 一 部 分 。 意 味 着 很 多 任务 可 以 并 行 地 处 理 而 不 
再 是 串 行 处 理 。 当 然 这 种 操作 系统 要 上 比 单 CPU 的 操作 系统 复杂 得 多 。 


7.2.5 “分 布 式 系统 


网 络 化 和 网 络 互联 的 发 展 (正如 我 们 在 第 6 章 所 看 到 的 那样 )， 扩 大 了 操作 系统 的 内 涵 。 
一 个 以 往 必 须 在 一 台 计 算 机 上 运行 的 作业 现在 可 以 由 远 隔 千里 的 多 台 计 算 机 共同 完成 。 程 序 
可 以 在 一 台 计 算 机 上 运行 一 部 分 而 在 另 一 台 计 算 机 上 运行 另 一 部 分 ， 只 要 它们 通过 网 络 〈 例 
如 因特网 ) 连接 即 可 。 资 源 可 以 是 分 布 式 的 ， 一 个 程序 需要 的 文件 可 能 分 布 在 世界 的 不 同 地 
方 。 分 布 式 系统 结合 了 以 往 系统 的 特点 和 新 的 功能 ， 例 如 安全 控制 。 


7.2.6 ”实时 系统 


实时 系统 是 指 在 特定 时 间 限 制 内 完成 任务 。 它 们 被 用 在 实时 应 用 程序 中 ， 这 些 应 用 程 
序 监 控 、 响 应 或 控制 外 部 过 程 或 环境 。 在 交通 控制 、 病 人 监控 或 军事 控制 系统 中 可 以 找到 
实时 系统 的 例子 。 应 用 程序 有 时 可 以 是 作为 大 系统 一 部 分 的 敌人 式 系 统 ， 如 汽车 中 的 控制 
系统 。 

实时 操作 系统 的 需求 经 常 与 通用 系统 的 需求 是 不 同 的 。 由 于 这 个 原因 ， 在 本 章 中 我 们 不 
讨论 它们 。 


7.3 组 成 部 分 


现在 的 操作 系统 十 分 复杂 ， 它 必须 可 以 管理 系统 中 的 不 同 资源 。 它 像 是 一 个 有 多 个 上 层 
部 门 经 理 的 管理 机 构 ， 每 个 部 门 经 理 负责 自己 的 部 门 管理 ， 并 且 相 互 协 调 。 现 代 操 作 系 统 至 
少 具有 以 下 4 种 功能 : 存储 管理 、 进 程 管理 、 设 备 管理 、 文 件 管理 。 就 像 很 多 组 织 有 一 个 部 
门 不 归 任 何 经 理 管理 一 样 ， 操 作 系统 也 有 这 样 一 个 部 分 ， 称 为 用 户 界面 或 命令 解释 程序 ， 它 
负责 操作 系统 与 外 界 通信 。 图 7-3 显示 了 操作 系统 的 组 成 部 分 。 
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图 7-3 ”操作 系统 的 组 成 部 分 


7.3.1 用户 界 面 


每 个 操作 系统 都 有 用 户 界面 ， 即 指 用 来 接收 用 户 (进程 ) 的 输入 并 向 操作 系统 解释 这 些 
请 求 的 程序 。 一 些 操作 系统 (比如 UNIX) 的 用 户 界面 ， 被 称 作 命令 解释 程序 ( shell) 。 在 其 
他 操作 系统 中 ， 则 被 称 为 窗口 ， 以 指明 它 是 一 个 由 菜单 驱动 的 并 有 着 GUI (图 形 用 户 接口 ) 
的 部 件 。 


7.3.2 ”内 存 管理 器 


现在 计算 机 操作 系统 的 一 个 重要 职责 是 内 存 管理 。 计 算 机 中 存储 器 的 容量 近年 来 得 到 激 
增 ， 同 样 所 处 理 的 程序 和 数据 也 越 来 越 大 。 内 存 分 配 必须 进行 管理 以 避免 “内 存 溢 出 ”的 错 
误 。 操 作 系统 按照 内 存 管理 可 以 分 为 两 大 类 : 单 道 程序 和 多 道 程序 。 

1. 单 道 程序 

单 道 程序 属于 过 去 ， 但 它 还 是 值得 学 习 ， 因 为 它 有 助 于 理解 多 道 程 序 。 在 单 道 程序 中 ， 
大 多 数 内 存 用 来 装载 单一 的 程序 (我 们 考虑 数据 作为 程序 的 一 个 部 分 被 程 
序 处 理 )， 仅 仅 一 小 部 分 用 来 装载 操作 系统 。 在 这 种 配置 下 ， 整 个 程序 装 人 
内 存 运行 ， 运 行 结束 后 ， 程 序 区 域 由 其 他 程序 取代 (图 7-4 )。 

这 里 内 存 管理 器 的 工作 是 简单 明了 的 ， 即 将 程序 载 人 内 存 、 运 行 它 、 
再 装 人 新 程序 。 但 是 ， 在 技术 方面 仍然 有 很 多 问题 : 

e 程序 必须 能 够 载 人 人 内存。 如 果 内 存 容 量 比 程序 小 ， 程 序 将 无 法 

e 当 一 个 程序 正在 运行 时 ， 其 他 程序 不 能 运行 。 一 个 程序 在 执行 过 程 

中 经 常 需要 从 输入 设备 得 到 数据 ， 并 且 把 数据 发 送 至 输出 设备 。 但 输入 /输出 设备 的 
速度 远 远 小 于 CPU， 所 以 当 输 入 /输出 设备 运行 时 ，CPU 处 于 空闲 状态 。 而 此 时 
由 于 其 他 程序 不 在 内 存 中 ，CPU 不 能 其 服务 。 这 种 情况 下 CPU 和 内 存 的 使 用 效率 
很 低 。 

2. 多 道 程序 操作 系统 

在 多 道 程序 下 ， 同 一 时 刻 可 以 装 人 多 个 程序 并 且 能 够 同时 被 执行 。 上 
CPU 轮流 为 其 服务 。 图 7-5 给 出 了 多 道 程序 的 内 存 分 配 。 

从 20 世纪 60 年 代 开 始 ， 多 道 程序 已 经 经 过 了 一 系列 改进 ， 如 图 7-6 
所 示 。 程序 3 

我 们 将 在 下 几 节 对 每 种 模式 作 简要 讨论 。 有 两 种 技术 属于 非 交换 范 内 存 
畴 ， 这 意味 着 程序 在 运行 期 间 始 终 驻 留 在 内 存 中 。 另 外 两 种 技术 属于 交换 图 7-5 多 道 程序 


操作 系统 


程序 





内 存 
图 7-4 单 道 程序 
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范畴 。 也 就 是 说 ， 在 运行 过 程 中 ， 程 序 可 以 在 内 存 和 硬盘 之 间 多 次 交换 数据 。 
(1 ) 分 区 调度 
多 道 程序 的 第 一 种 技术 称 为 分 区 调度 。 
在 这 种 模式 中 ， 内 存 被 分 为 不 定 长 的 几 个 分 
区 。 每 个 部 分 或 分 区 保存 一 个 程序 。CPU 在 
各 个 程序 之 间 交替 服务 。 它 由 一 个 程序 开始 ， 分 oe 
执行 一 些 指令 ， 直 到 有 输入 /输出 操作 或 者 
分 配给 程序 的 时 限 到 达 为 止 。CPU 保存 最 近 人 
使 用 的 指令 所 分 配 的 内 存 地 址 后 转 人 下 一 个 程序 。 对 下 一 个 程序 采用 同样 的 步骤 反复 执行 下 
去 。 当 所 有 程序 服务 完毕 后 ， 再 转 回 第 一 个 程序 。 当 然 ，CPU 可 以 进行 优先 级 管理 ， 用 于 
控制 分 配给 每 个 程序 的 CPU 时 间 (图 7-7 ) 。 
内 存 内 存 
操作 系统 操作 系统 
程序 1 





多 道 程序 











程序 2 


a) CPU 开 始 执行 程序 1 b) CPU 开 始 执 行程 序 2 
图 7-7 分 区 调度 


在 这 种 技术 下 ， 每 个 程序 完全 载 人 内 存 ， 并 占用 连续 的 地 址 。 分 区 调度 改进 了 CPU 的 
使 用 效率 ， 但 仍 有 以 下 一 些 问题 : 

。 分 区 的 大 小 必须 由 内 存 管理 器 预先 决定 。 如 果 分 区 小 了 ， 有 的 程序 就 不 能 载 人 内 存 。 

如 果 分 区 大 了 ， 就 会 出 现 空闲 区 。 
。 即使 分 区 在 刚 开 始 时 比较 合适 ， 但 随 着 新 程序 的 交换 载 人 内 存 后 有 可 能 出 现 空闲 区 。 
。 当空 亲 区 过 多 时 ， 内 存 管理 器 能 够 紧缩 分 区 并 删除 空闲 区 和 创建 新 区 ， 但 这 将 增加 
系统 额外 开销 。 

(2 ) 分 页 调度 

分 页 调度 提高 了 分 区 调度 的 效率 。 在 分 页 调度 下 ， 内 存 被 分 成 大 小 相等 的 若干 个 部 分 ， 
称 为 帧 。 程 序 则 被 分 为 大 小 相等 的 部 分 ， 称 为 页 。 页 和 帧 的 大 小 通常 是 一 样 的 ， 并 且 与 系统 
用 于 从 存储 设备 中 提取 信息 的 块 大 小 相等 (图 7-8 )。 

页 被 载 人 内 存 中 的 帧 。 如 果 一 个 程序 有 3 页 ， 它 
就 在 内 存 中 占用 3 个 帧 。 在 这 种 技术 下 ， 程 序 在 内 存 
中 不 必 是 连续 的 : 两 个 连续 的 页 可 以 占用 内 存 中 不 连 
续 的 两 个 帧 。 分 页 调度 对 分 区 调度 的 优势 在 于 ， 一 个 
需要 6 个 帧 的 程序 可 以 代替 两 个 各 占有 不 连续 的 3 个 国 汪 
帧 的 程序 。 而 不 必 等 到 有 6 个 连续 的 帧 出 现 后 再 载 人 国生 
内 存 。 

分 页 调度 在 一 定 程度 上 提高 了 效率 ， 但 整个 程序 仍 
需要 在 运行 前 全 部 载 人 内 存 。 这 意味 着 在 只 有 4 个 不 连 
续 帧 时 ， 一 个 需要 6 个 空闲 帧 的 程序 是 不 能 载 入 的。 图 7-8 分 页 调度 
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(3 ) 请 求 分 页 调度 

分 页 调度 不 需要 程序 装载 在 连续 的 内 存 中 ,但 仍 需 要 程序 整体 载 人 内 存 中 运行 。 请 求 分 页 
调度 改变 了 后 一 种 限制 。 在 请 求 分 页 调度 中 ， 程 序 被 分 成 页 ， 但 是 页 可 以 依次 载 信 内存、 运行 ， 
然后 被 另 一 个 页 代替 。 换 句 话 说， 内 存 可 以 同时 载 人 多 个 程序 的 页 。 此 外 ,来 自 同 一 个 程序 的 
连续 页 可 以 不 必 载 人 同一 个 帧 ， 一 个 页 可 以 载 人 任何 一 个 空闲 帧 。 图 7-9 显示 了 请 求 分 页 调度 
的 一 个 例子 。 两 页 来 自 程序 A， 一 页 来 自 程序 B， 一 页 来 自 程序 C， 这 4 页 在 内 存 中 。 

(4 ) 请 求 分 段 调 度 

类 似 于 分 页 调度 的 技术 是 分 段 调度 。 在 分 页 调度 中 ， 不 像 程序 员 以 模块 来 考虑 程序 ， 程 
序 实际 是 分 为 大 小 相等 的 页 。 你 将 在 后 面 的 章节 中 看 到 ， 程 序 通常 由 主 程序 和 子 程序 组 成 ， 
在 请 求 分 段 调度 中 ， 程 序 将 按 程 序 员 的 角度 划分 成 段 ， 它 们 载 人 内 存 中 、 执 行 ， 然 后 被 来 自 
同一 程序 或 其 他 程序 的 模块 所 代替 。 图 7-10 显示 了 请 求 分 段 调度 的 一 个 例子 。 因 为 在 内 存 
中 的 段 是 等 长 的 ， 所 以 段 的 一 部 分 可 能 是 空 的 。 
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图 7-9 请 求 分 页 调度 图 7-10 ”请求 分 段 调度 


(5 ) 请 求 分 页 和 分 段 调 度 

请 求 分 页 和 分 段 调度 结合 了 两 者 的 优点 以 提高 系统 效率 。 一 个 段 也许 太 大 而 不 能 载 和 人 内 
存 中 的 空闲 区 。 内 存 可 以 分 成 很 多 帧 ， 一 个 模块 可 以 分 成 很 多 页 ， 依 次 装 和 人 内 存 运行 。 

3. 虚拟 内 存 

请 求 分 页 调度 和 请 求 分 段 调度 意味 着 当 程 序 运 行 时 ， 一 部 分 程序 驻 留 在 内 存 中 ， 一 部 分 
则 放 在 硬盘 上 。 这 就 意味 着 ， 例 如 ，10 MB 内 存 可 以 运行 10 个 程序 。 每 个 程序 3 MB， 一 
共 30 MB。 任 一 时 候 10 个 程序 中 10 MB 在 内 存 中 ， 还 有 20 MB 在 磁盘 上 。 这 里 实际 上 只 
有 10 MB 内 存 但 却 有 30 MB 的 虚拟 内 存 。 如 图 7-11 所 示 展 示 了 这 个 概念 。 虚 拟 内 存 意味 着 
请 求 分 页 调度 、 请 求 分 段 调 度 ， 或 两 种 都 有 ， 
如 今 几 乎 所 有 的 操作 系统 都 使 用 了 该 技术 。 


7.3.3 ”进程 管理 器 


操作 系统 的 第 二 个 功能 是 进程 管理 ， 在 介 
绍 该 概念 之 前 ， 我 们 先 定义 一 些 术语 。 

1. 程序 、 作 业 和 进程 

现代 操作 系统 关于 指令 集 有 三 个 术语 : 程 
序 、 作 业 和 进程 。 尽 管 这 些 术 语 比较 模糊 ， 并 
且 不 同 的 操作 系统 对 于 它们 的 定义 并 不 一 致 ， 图 7-11 虚拟 内 存 
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我 们 还 是 可 以 作出 非 正 式 的 定义 。 

(1) 程序 

程序 是 由 程序 员 编 写 的 一 组 稳定 的 指令 ， 存 在 磁盘 (或 磁带 ) 上 ， 它 可 能 会 也 可 能 不 会 
成 为 作业 。 

(2 ) 作业 

从 一 个 程序 被 选中 执行 ， 到 其 运行 结束 并 再 次 成 为 一 个 程序 的 这 段 过 程 中 ， 该 程序 称 为 
作业 。 在 整个 过 程 中 ， 作 业 可 能 会 或 不 会 被 执行 ， 或 者 驻 留 在 磁盘 上 等 待 调 人 内 存 ， 或 者 在 
内 存 中 等 待 CPU 执行 ， 或 者 驻 留 在 硬盘 或 内 存 中 等 待 一 个 输入 /输出 事件 ， 或 者 在 内 存 中 
等 待 直到 被 CPU 运行 。 在 所 有 这 些 情况 下 程序 才 称 为 作业 。 当 一 个 作业 执行 完毕 (正常 或 
不 正常 )， 它 又 变 成 程序 代码 并 再 次 驻 留 于 硬盘 中 ， 操 作 系 统 不 再 支配 该 程序 。 需 要 注意 的 
是 ， 每 个 作业 都 是 程序 ， 但 并 不 是 所 有 的 程序 都 是 作业 。 

(3 ) 进程 

进程 是 一 个 运行 中 的 程序 。 该 程序 开始 运行 但 还 未 结束 。 换 句 话 说， 进程 是 一 个 驻 留 在 
内 存 中 运行 的 作业 ， 它 是 从 众多 等 待 作业 中 选取 出 来 并 装 和 内存 中 的 作业 。 一 个 进程 可 以 处 
于 运行 状态 或 者 等 待 CPU 调用 。 只 要 作业 装 人 内 存 就 成 为 一 个 进程 。 需 要 注意 的 是 ， 每 个 
进程 都 是 作业 ， 而 作业 未 必 是 进程 。 

2. 状态 图 

当 明 白 程序 怎样 变 成 作业 和 作业 怎样 变 成 进程 时 ， 和 程序、 作业、 进程 的 关系 也 就 很 明显 
了 。 状 态 图 显示 了 每 个 实体 的 不 同 状 态 ， 图 7-12 中 用 框 线 将 这 三 者 分 开 。 

一 个 程序 当 被 操作 系统 选中 时 就 成 为 
作业 并 且 成 为 保持 状态 。 直 至 它 载 人 内 存 
之 前 都 保持 这 个 状态 。 当 内 存 可 以 整体 或 
者 部 分 地 载 人 这 个 程序 时 ， 作 业 转 成 就 绪 
状态 ， 并 变 成 进程 。 它 在 内 存 中 保持 这 个 
状态 直至 CPU 运行 它 ; 这 时 它 转 成 运行 状 
态 。 当 处 于 运行 状态 后 ， 可 能 出 现下 面 三 
种 情况 之 一 : 

e 进程 运行 直至 它 需 要 IO 资源 

e 进程 可 能 耗 尽 所 分 配 的 时 间 片 。 

e 进程 终止 。 

在 第 一 种 情况 下 ， 进 程 进入 等 待 状态 图 7-12 程序 、 作 业 和 进程 分 界 状态 图 
直至 输入 /输出 结束 。 在 第 二 种 情况 下 ， 它 直接 进入 就 绪 状 态 。 在 第 三 种 情况 下 ， 它 进入 
终止 状态 ， 并 且 不 再 是 进程 。 进 程 进入 终止 状态 前 在 运行 、 等 待 、 就 绪 状 态 中 转换 。 注 
意 ， 如 果 系 统 使 用 虚拟 内 存 ， 并 且 需 要 在 内 存 中 将 程序 交换 出 或 换 入 ， 状 态 图 可 能 更 加 
复杂 。 

3. 调度 器 

将 一 个 作业 或 进程 从 一 个 状态 改变 为 另 一 个 状态 ， 进 程 管理 器 使 用 了 两 个 调度 器 : 作业 
调度 器 和 进程 调度 器 。 

(1 ) 作业 调度 器 

作业 调度 器 将 一 个 作业 从 保持 状态 转 人 就 绪 状 态 ， 或 是 从 运行 状态 转 人 终止 状态 。 换 名 








* 的 状态 关系 框图 。 
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话说 ， 作 业 调 度 器 负责 从 作业 中 创建 一 个 进程 和 终止 一 个 进程 。 图 7-13 给 出 了 作业 调度 器 


(2 ) 进程 调度 器 
进程 调度 器 将 一 个 进程 从 一 个 状态 转 入 另 
一 个 状态 。 当 一 个 进程 等 待 某 事件 发 生 时 ， 它 
使 这 一 进程 从 运行 状态 进入 等 待 状 态 。 当 事件 
发 生 时 ， 进 程 将 从 等 待 状态 进入 就 绪 状态 。 当 
一 个 进程 所 分 配 的 时 间 片 用 完 时 ， 这 个 进程 将 
从 运行 状态 进入 就 绪 状 态 。 当 CPU 准备 执行 这 图 7-13 作业 调度 器 
个 进程 时 ， 进 程 调度 器 将 让 这 个 进程 从 就 绪 状 态 进入 执行 状态 。 图 7-14 给 出 了 进程 调度 器 
的 状态 关系 框图 。 








图 7-14 进程 调度 器 


(3 ) 其 他 调度 器 

一 些 操作 系统 使 用 其 他 类 型 的 调度 器 使 进程 之 间 的 转换 更 为 有 效 。 

4. 队列 

状态 图 显示 了 一 个 作业 或 进程 从 一 个 状态 进入 另 一 个 状态 。 事 实 上 ,会 有 很 多 的 作业 和 
进程 相互 竞争 计算 机 资源 。 例 如 ， 当 一 些 作业 进入 内 存 时 ， 其 他 的 就 必须 等 待 直到 有 了 可 用 
空间 。 或 者 当 一 个 进程 正在 使 用 CPU 时 ， 其 他 进程 就 必须 等 待 直到 CPU 空闲 为 止 。 为 处 理 
多 个 进程 和 作业 ， 进 程 管 理 器 使 用 队列 (等 待 列表 )。 与 每 一 作业 或 进程 相关 的 是 存 有 这 些 
作业 和 进程 信息 的 作业 控制 块 或 进程 控制 块 。 进 程 管理 在 队列 中 存储 的 不 是 作业 或 进程 ， 而 
是 作业 或 进程 控制 块 。 作 业 和 进程 仍 保存 在 内 存 或 硬盘 中 ; 它们 因为 太 大 而 无 法 被 复制 到 队 
列 中 。 这 些 作 业 控 制 块 或 进程 控制 块 就 是 等 待 中 的 作业 和 进程 的 代表 。 

一 个 操作 系统 有 很 多 个 队列 。 例 如 ， 图 7-15 给 出 的 作业 和 进程 在 三 个 队列 里 循环 : 作 
业 队 列 、 就 绪 队 列 和 IO 队列。 作业 队列 用 来 保存 那些 等 待 内 存 的 作业 。 就 绪 队列 用 来 保存 
那些 已 经 在 内 存 中 准备 好 运行 但 在 等 待 CPU 的 进程 。I/O 队列 用 来 保存 那些 正在 等 待 IO 设 
备 的 进程 (这 里 可 以 有 多 个 IO 队列 ， 每 一 个 对 应 一 个 输入 / 输出 设备 ， 这 里 为 了 简单 只 画 
出 一 个 )。 

进程 管理 器 可 以 用 多 种 策略 从 队列 中 选择 下 一 个 作业 或 进程 ; 可 以 是 先 人 先 出 (FIFO)、 
最 短 长 度 优先 、 最 高 优先 级 等 。 

5. 进程 同步 

所 有 的 进程 管理 的 思想 都 是 使 得 拥有 不 同 资源 的 不 同 进程 同步 。 只 要 资源 可 以 被 多 个 用 
户 (进程 ) 同时 使 用 ， 那 么 它 就 可 能 有 两 种 有 问题 的 状态 : 死 锁 和 饿 死 。 下 面 简略 说 明 一 下 
这 两 种 状态 。 
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图 7-15 ”进程 管理 队列 


(1 ) 死 锁 

我 们 先 不 给 出 死 锁 的 正式 定义 ， 先 看 一 个 例子 。 假 定 有 两 个 进程 A 和 B， 进 程 A 已 经 
占有 了 一 个 名 为 Filel 的 文件 ( Filel 已 经 分 配给 了 A)， 而 它 只 有 得 到 另 一 个 名 为 File2 的 文 
件 (A 已 经 请 求 了 File2 ) 才能 够 释放 File1。 进 程 B 已 经 占有 了 File2 文件 (File2 已 经 分 配 
给 了 B)， 而 它 只 有 得 到 Filel 文件 (B 已 经 请 求 了 Filel ) 才能 够 释放 File2。 在 大 多 数 操作 
系统 中 ,文件 都 是 不 可 共享 的 ;， 当 文件 被 一 个 进程 使 用 时 ， 将 不 能 再 被 别 的 进程 使 用 。 在 这 
种 情况 下 ， 如 果 没 有 强制 一 个 进程 释放 文 


被 分 配给 已 请 求 
件 的 防备 措施 ， 就 会 发 生死 锁 (图 7-16 )。 机 
图 7-17 用 罕 桥 来 模拟 死 锁 。 罕 桥 的 情 “文件 !| 恒 二 
况 与 死 锁 类 似 ， 因 为 资源 ( 桥 的 一 端 ) 被 一 
辆 车 占用 ， 该 车 只 有 到 达 桥 的 另 一 端 才 会 EE 
释放 资源 ， 而 此 时 另 一 端正 被 另 一 辆 车 占 图 7-16 死 锁 


用 着 。 反 过 来 看 情况 也 一 样 。 





图 7-17 在 桥 上 的 死 锁 


死 锁 发 生 在 操作 系统 允许 一 个 进程 运行 ， 而 不 用 首先 检查 它 所 必需 的 资源 是 否 准 备 好 ， 
是 否 允许 这 个 进程 占有 资源 直到 它 不 需要 为 止 。 操 作 系 统 中 需要 有 一 些 措施 来 防止 死 锁 。 一 
种 解决 方法 是 当 所 需 资源 不 空 闪 时 ， 不 允许 进程 运行 。 但 后 面 会 发 现 这 样 做 将 导致 男 一 种 问 
题 。 另 一 种 解决 方法 是 限制 进程 占有 资源 的 时 间 。 
对 进程 的 资源 进行 限制 时 将 会 发 生死 锁 。 

死 锁 不 是 经 常 发 生 ， 死 锁 发 生 需 要 4 个 必要 条 件 : 

e 互 斥 。 一 个 资源 只 能 被 一 个 进程 占有 ; 

e 资源 占有 。 一 个 进程 占有 一 个 资源 ， 即 使 在 获取 其 他 资源 之 前 无 法 使 用 它 ; 

e 抢先 。 操 作 系统 不 能 临时 对 资源 重新 分 配 ; 

e 循环 等 待 。 所 有 的 进程 和 资源 包含 在 一 个 循环 里 ， 如 图 7-16 所 示 。 

所 有 4 个 条 件 都 是 死 锁 发 生 所 必需 的 。 但 是 它们 只 是 必要 条 件 (不 是 充分 条 件 )， 也 就 
是 说 对 于 死 锁 来 说 它们 必须 同时 出 现 ， 但 它们 并 不 一 定 能 引起 死 锁 。 换 名 话说， 如 果 它 们 其 
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中 之 一 没有 出 现 ， 死 锁 不 会 发 生 。 这 样 就 给 我 们 提供 了 一 种 方法 来 防止 或 避免 死 锁 : 不 让 它 
们 中 的 某 一 条 件 发 生 。 

(2 ) 饭 死 

俄 死 是 一 种 与 死 锁 相 反 的 情况 。 它 发 生 在 当 操作 系统 对 进程 分 配 资源 有 太 多 限制 的 
时 候 。 例 如 ， 假 使 一 个 操作 系统 中 规定 一 个 进程 只 有 在 所 需 的 所 有 资源 都 为 其 占有 时 才能 
执行 。 

在 图 7-18 中 ， 假 设 进程 A 需要 两 个 文件 Filel 和 File2。Filel 正在 被 进程 B 使 用 ，File2 
正在 被 进程 E 使 用 。 进 程 B 将 首先 终止 并 释放 Filel ， 但 进程 A 一 直 不 能 执行 是 因为 File2 
一 直 不 被 释放 。 与 此 同时 ， 进 程 C 由 于 只 需要 Filel 而 被 允许 执行 。 这 时 进程 也 终止 且 释 放 
File2， 但 进程 A 还 是 不 能 执行 ， 因 为 Filel 正 被 使 用 。 








【被 分 配给 ”被 分 配给 


@ 必 


c) 进程 A 还 需要 File1 和 File2 两 者 ( 饿 死 ) 
图 7-18 饿 死 


Edsger Dijkstra 介绍 过 一 个 经 典 的 饿 死 问题 。 五 个 哲学 家 围 坐 在 一 个 圆桌 前 (图 7-19 )， 
每 个 哲学 家 需要 用 两 只 筷子 来 吃 太 里 的 米饭 。 然 而 ， 有 一 只 或 两 只 筷子 可 能 被 邻 座 的 人 使 用 
了 。 如 果 没 有 两 只 筷子 同时 可 用 ， 有 一 位 哲学 家 将 被 俄 死 。 

6. 设备 管理 器 OG 

设备 管理 器 (或 者 是 输入 / 输出 管理 器 ) 负责 访问 输 
入 /输出 设备 。 在 计算 机 系统 中 输入 / 输出 设备 存在 着 数量 IO) 
和 速度 上 的 限制 。 由 于 这 些 设备 与 CPU 和 内 存 比 起 来 速度 me © 号 
要 慢 很 多 ， 所 以 当 一 个 进程 访问 输入 / 输出 设备 时 ， 在 该 
段 时 间 内 这 些 设备 对 其 他 进程 而 言 是 不 可 用 的 。 设 备 管理 
器 负责 让 输入 / 输出 设备 使 用 起 来 更 有 效 。 ee 

对 设备 管理 器 细节 的 讨论 需要 掌握 有 关 操 作 系统 原理 © /9 
的 高 级 知识 ， 这 些 都 不 在 本 书 讨论 之 列 。 但 是 我 们 可 以 在 
这 里 简要 地 列 出 设备 管理 器 的 功能 。 图 7-19 哲学 家 吃饭 问题 
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®。 设备 管理 器 不 停 地 监视 所 有 的 输入 /输出 设备 ， 以 保证 它们 能 够 正常 和 运行。 管理 器 
同样 也 需要 知道 何 时 设备 已 经 完成 一 个 进程 的 服务 ， 而 且 能 够 为 队列 中 下 一 个 进程 
服务 。 

设备 管理 器 为 每 一 个 输入 / 输出 设备 维护 一 个 队列 ， 或 是 为 类 似 的 输入 / 输出 设备 
维护 一 个 或 多 个 队列 。 例 如 ， 如 果 系 统 中 有 两 台 高 速 打印 机 ， 管 理 器 能 够 分 别 用 一 
个 队列 维护 一 个 设备 ， 或 是 用 一 个 队列 维护 两 个 设备 。 

设备 管理 器 控制 用 于 访问 输入 /输出 设备 的 不 同 策略 。 例 如 ， 可 以 用 先 人 先 出 法 来 
维护 一 个 设备 ， 而 用 最 短 长 度 优 先 来 维护 另 一 个 设备 。 


7.3.4 ”文件 管理 器 


现今 的 操作 系统 使 用 文件 管理 器 来 控制 对 文件 的 访问 。 对 文件 管理 器 细节 的 讨论 同样 需 
要 掌握 有 关 操作 系统 原理 和 文件 访问 的 高 度 概 念 ， 这 些 超出 了 本 书 的 讨论 范围 。 我 们 将 在 第 
13 章 中 讨论 一 些 有 关 文件 访问 的 问题 ， 但 这 对 于 了 解 文件 管理 器 实际 的 操作 还 不 够 。 下 面 
简 述 一 下 文件 管理 器 的 功能 : 
。 文件 管理 器 控制 文件 的 访问 。 只 有 那些 获得 允许 的 应 用 程序 才能 够 访问 ， 访 问 方式 
也 可 以 不 同 。 例 如 ， 一 个 进程 〈 或 一 个 调用 进程 的 用 户 ) 也 许可 以 读 取 文 件 ， 但 却 不 
允许 写 (改变 ) 操作 。 另 一 个 进程 也 许 被 允许 执行 文件 和 进程 ， 但 却 不 允许 读 取 文 件 
的 内 容 。 
。 文件 管理 器 管理 文件 的 创建 、 删 除 和 修改 。 
e 文件 管理 器 可 以 给 文件 命名 。 
。 文件 管理 器 管理 文件 的 存储 : 怎样 存储 ， 存 在 哪里 等 。 
。 文件 管理 器 负责 归档 和 备份 。 


7.4 主流 操作 系统 


在 这 一 节 ， 我 们 将 介绍 一 些 常 用 的 操作 系统 ， 以 促进 将 来 的 学 习 。 我 们 选择 三 种 计算 机 
用 户 熟 悉 的 操作 系统 : UNIX、Linux 和 Windows。 


7.4.1 UNIX 


UNIX 是 由 贝尔 实验 室 的 计算 机 科学 研究 小 组 的 Thomson 和 Ritchie 在 1969 年 首先 开 
发 出 来 的 。 从 那 时 起 ，UNIX 经 历 了 许多 版 本 。 它 是 一 个 在 程序 设计 员 和 计算 机 科学 家 中 较 
为 流行 的 操作 系统 。 它 是 一 个 非常 强大 的 操作 系统 ， 有 三 个 显著 的 特点 。 第 一 ，UNIX 是 一 
个 可 移植 的 操作 系统 ， 它 可 以 不 经 过 较 大 的 改动 而 方便 地 从 一 个 平台 移植 到 另 一 个 平台 。 原 
因 是 它 主要 是 由 C 语言 编写 的 (而 不 是 特定 于 某 种 计算 机 系统 的 机 器 语言 )。 第 二 ，UINX 
拥有 一 套 功能 强大 的 工具 (命令 )， 它 们 能 够 组 合 起 来 (在 可 执行 文件 中 被 称 为 脚本 ) 去 解 
决 许 多 问题 ， 而 这 一 工作 在 其 他 操作 系统 中 则 需要 通过 编程 来 完成 。 第 三 ， 它 具有 设备 无 
关 性 ， 因 为 操作 系统 本 身 就 包含 了 设备 驱动 程序 ， 这 意味 着 它 可 以 方便 地 配置 来 运行 任何 
设备 。 

UNIX 是 多 用 户 、 多 道 程 序 、 可 移植 的 操作 系统 ， 它 被 设计 来 方便 编程 、 文 本 处 理 、 通 
信和 其 他 许多 希望 操作 系统 来 完成 的 任务 。 它 包含 几 百 个 简单 、 单 一 目的 的 函数 ， 这 些 函 数 
能 组 合 起 来 完成 任何 可 以 想象 的 处 理 任务 。 它 的 灵活 性 通过 它 可 以 用 在 三 种 不 同 的 计算 环境 
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中 而 得 到 证 明 ， 这 三 种 环境 为 : 单机 个 人 环境 、 分 时 系统 和 客户 / 服务 器 系统 。 

UNIX 是 多 用 户 、 多 道 程序 、 可 移植 的 操作 系统 ， 它 被 设计 来 方便 编程 、 文 本 处 理 、 通 信 。 

UNIX 结构 

UNIX 由 4 个 主要 部 分 构成 : 内 核 、 命 令 解释 
器 、 一 组 标准 工具 和 应 用 程序 。 这 些 组 成 部 分 显示 
在 图 7-20 中 。 

(1) 内 核 . 

内 核 是 UNIX 系统 的 心脏 。 它 包含 操作 系统 最 
基本 的 部 分 : 内 存 管理 、 进 程 管理 、 设 备 管理 和 文 
件 管理 。 系 统 所 有 其 他 部 分 均 调用 内 核 来 执行 这 些 
服务 。 

(2 ) 命令 解释 器 

命令 解释 器 是 UNIX 中 用 户 最 可 见 的 部 分 。 它 
接收 和 解释 用 户 输入 的 命令 。 在 许多 方面 ， 这 使 它 
成 为 UNIX 结构 的 最 重要 的 组 成 部 分 。 它 肯定 也 是 
用 户 最 知道 的 部 分 。 为 了 在 系统 做 任何 事情 ， 我 们 
必须 向 命令 解释 器 输入 命令 。 如 果 命 令 需要 一 个 工具 ， 命 令 解 释 器 将 请 求 内 核 执 行 该 工具 。 
如 果 命 令 需 要 一 个 应 用 程序 ， 命 令 解释 器 需要 内 核 运 行 它 。 有 些 操作 系统 (如 UNIX) 有 几 
种 不 同 的 命令 解释 器 。 

(3 ) 工具 

UNIX 中 有 几 百 个 工具 。 工 具 是 UNIX 标准 程序 ， 它 为 用 户 提供 支持 过 程 。 常 用 的 三 个 
工具 是 : 文本 编辑 器 、 搜 索 程序 和 排序 程序 。 

许多 系统 工具 实际 上 复杂 的 应 用 程序 。 例 如 ，UNIX 的 电子 邮件 系统 被 看 成 一 个 工具 ， 
就 像 三 种 常见 文本 编辑 器 : vi、emacs 和 pico。 所 有 这 4 个 工具 本 身 都 是 大 的 系统 。 其 他 工 
具 是 简短 函数 。 例 如 ，list (ls) 工具 显示 磁盘 目录 中 的 文件 。 

(4) 应 用 

UNIX 的 应 用 是 指 一 些 程 序 ， 它 们 不 是 操作 系统 发 布 中 的 标准 部 分 。 它 们 是 由 系统 管理 
员 、 专 职 程 序 员 或 用 户 编写 的 ， 提 供 了 对 系统 的 扩展 能 力 。 事 实 上 ， 许 多 标准 工具 自 多 年 前 
都 是 作为 应 用 出 现 的 ， 后 来 被 证 明 非 常 有 用 ， 现 在 就 成 了 系统 的 一 部 分 。 


7.4.2 Linux 


在 1991 年， 芬兰 Helsinki 大 学 的 学 生 Linus Torvalds 开发 了 一 个 新 的 操作 系统 ， 这 就 
是 如 今 所 知 的 Linux。 初 始 内 核 (与 UNIX 小 子 集 相似 ) 如 今 成 长 为 全 面 的 操作 系统 。1997 
年 发 布 的 Linus 2.0 内 核 成 为 商业 操作 系统 ， 它 具有 传统 UNIX 的 所 有 特性 。 

1. 组 成 

Linux 有 下 列 组 成 部 分 。 

(1) 内 核 

内 核 负 责 处 理 所 有 属于 内 核 的 职责 ， 如 : 内 存 管理 、 进 程 管理 、 设 备 管理 和 文件 管理 。 

(2 ) 系统 库 

系统 库 含 有 一 组 被 应 用 程序 使 用 的 函数 (包括 命令 解释 器 )， 用 于 与 内 核 交 互 。 





图 7-20 ”UNIX 操作 系统 的 组 成 部 分 
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(3 ) 系统 工具 
系统 工具 是 使 用 系统 库 提 供 的 服务 ， 执 行 管理 任务 的 各 个 程序 。 
2. 网 络 功能 


Linux 支持 第 6 章 中 讨论 的 标准 因特网 协议 。 它 支持 三 层 : 套 接 字 接口 、 协 议 驱 动 和 网 
络 设备 驱动 。 

3. 安全 

Linux 的 安全 机 制 提 供 了 传统 上 为 UNIX 定义 的 安全 特性 。 如 身份 验证 和 访问 控制 。 


7.4.3 Windows 


20 世纪 80 年 代 后 期 ， 在 Dave Cutler 的 领导 下 ， 微 软 开始 开发 替代 MS-DOS (微软 磁 
盘 操 作 系 统 ) 的 新 的 单 用 户 操作 系统 。Windows 就 是 结果 。 后 来 又 有 几 个 Windows 的 版 本 ， 
我 们 统称 这 些 版 本 为 Windows。 

1. 设计 目标 

微软 发 布 的 设计 目标 是 : 可 扩展 性 、 可 移植 性 、 可 靠 性 、 兼 容 性 和 性 能 。 

(1 ) 可 扩展 性 

Windows 被 设计 成 具有 多 层 的 模块 化 体系 结构 。 意 图 是 允许 高 层 随 时 间 而 改变 ， 而 不 影 
响 底 层 。 

(2 ) 可 移植 性 

像 UNIX 一 样 ，Windows 是 用 C 或 C++ 编写 的 ， 这 个 语言 是 独立 于 它 所 运行 的 计算 机 
的 机 器 语言 日 的 o 

(3 ) 可 靠 性 

Windows 被 设计 成 能 处 理 包括 防止 恶意 软件 的 错误 条 件 。 

(4) 兼容 性 

Windows 被 设计 成 能 运行 为 其 他 操作 系统 编写 的 程序 ， 或 Windows 早期 版 本 。 

(5 ) 性 能 

Windows 被 设计 成 对 运行 在 操作 系统 顶部 的 应 用 程序 ， 具 有 快速 响应 时 间 。 

2. 体系 结构 

Windows 使 用 层次 体系 结构 ， 如 图 7-21 所 示 。 








图 7-21 Windows 的 体系 结构 


(1) HAL 

硬件 抽象 层 (HAL) 为 上 层 隐藏 了 硬件 的 差异 。 

(2 ) 内 核 

内 核 是 操作 系统 的 心脏 。 它 是 面向 对 象 软件 的 一 个 片段 。 该 面向 对 象 的 软件 把 任何 实体 
都 看 成 对 象 。 

(3 ) 执行 者 

Windows 执行 者 为 整个 操作 系统 提供 服务 。 它 由 6 个 子 系统 构成 : 对 象 管理 器 、 安 全 引 
用 监控 器 、 进 程 管理 器 、 虚 拟 内 存 管理 器 、 本 地 过 程 调用 工具 和 IO 管理 。 大 多 子 系统 是 我 
们 前 面 讨论 操 作 子 系统 中 所 熟悉 的 。 有 些 子 系统 ( 像 对 象 管理 器 ) 被 加 到 Windows 中 ， 是 因 
为 它 的 面向 对 象 的 本 质 。 执 行者 运行 在 内 核 态 (特权 )。 

(4 ) 环境 子 系统 

这 些 子 系统 被 设计 用 来 允许 Windows 运行 那些 为 Windows、 其 他 操作 系统 或 Windows 
早期 版 本 设计 的 应 用 程序 。 运 行为 Windows 设计 的 应 用 的 本 地 子 系统 称 为 Win32。 环 境 子 
系统 运行 在 用 户 态 (无 特权 )。 


7.5 ” 章 末 材料 
推荐 读物 

有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 

© Bic,L. and Shaw, A. Operating Systems Principles, Upper Saddle River, NJ: Prentice 
Hall, 2003 
McHoes, A. and Flynn, I. Understanding Operating Systems, Boston, MA: Course 
Technology, 2007 
Nutt, G. Operating Systems: A Modern Perspective, Reading, MA: Addison Wesley, 
2001 
Silberschatz, A. and Galvin, P. Operating Systems Concepts, New York: Wiley, 2004 


小 结 


操作 系统 是 计算 机 硬件 和 用 户 间 的 接口 。 它 方便 程序 的 执行 和 对 硬 软 件 资源 的 访问 。 
操作 系统 的 两 个 主要 设计 目标 是 硬件 的 高 效 使 用 和 资源 的 方便 使 用 。 

操作 系统 经 历 了 一 个 很 长 的 演化 历史 : 批 处 理 系 统 、 分 时 系统 、 单 用 户 系统 、 并 行 
系统 和 分 布 式 系 统 。 现 代 操 作 系统 至 少 有 4 个 功能 区 域 : 内 存 管理 器 、 进 程 管 理 器 、 
设备 管理 器 、 文 件 管理 器 ， 操 作 系统 还 提供 用 户 界面 。 

现代 操作 系统 的 第 一 职责 是 内 存 管理 。 内 存 分 配 必须 由 操作 系统 控制 。 内 存 管 理 技 
术 可 以 分 成 两 类 : 单 道 程序 和 多 道 程序 。 在 单 道 程序 中 ， 内 存 的 大 部 分 容量 都 为 一 
个 程序 独 享 。 在 多 道 程 序 中 ， 多 个 程序 同时 在 内 存 中 。 

现代 操作 系统 的 第 二 职责 是 进程 管理 。 进 程 是 运行 的 程序 。 进 程 管理 使 用 调度 器 和 
队列 来 管理 进程 。 进 程 管理 涉及 具有 不 同 资源 的 不 同 进程 间 的 同步 问题 。 这 可 能 潜 
在 地 造成 资源 死 锁 和 狐 死 。 死 锁 是 指 一 个 进程 由 于 其 他 进程 无 限制 地 使 用 资源 导致 
无 法 运行 的 情况 。 饿 死 是 指 一 个 进程 由 于 资源 分 配 限制 太 多 而 不 能 执行 的 情况 。 
现代 操作 系统 的 第 三 职责 是 设备 或 IO 管理 。 在 计算 机 系统 中 ， 输 入 /输出 设备 在 数 
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目 和 速度 上 都 有 限制 。 因 为 这 些 设备 与 CPU 和 内 存 相 比 ， 速 度 很 慢 ， 所 以 ， 当 一 个 
进程 访问 输入 /输出 设备 时 ， 它 对 其 他 进程 就 不 可 用 。 设 备 管理 器 负责 输入 /输出 设 
备 的 高 效 使 用 。 

现代 操作 系统 的 第 四 职责 是 文件 管理 。 操 作 系 统 使 用 文件 管理 器 控制 对 文件 的 访问 。 
只 有 进程 或 用 户 被 允许 访问 指定 文件 时 ， 访 问 才 被 允许 。 访 问 的 类 型 可 以 改变 。 

e 具有 一 些 类 似 性 的 两 个 常见 的 操作 系统 是 UNIX 和 Linux。UNIX 是 多 用 户 、 多 进程 、 
可 移植 的 操作 系统 ， 它 由 四 部 分 构成 : 内 核 、 命 令 解 释 器 、 一 组 标准 工具 和 应 用 程 
序 。Linux 由 三 部 分 构成 : 内 核 、 系 统 工具 和 系统 库 。 

微软 流行 的 操作 系统 家 族 是 Windows。Windows 是 面向 对 象 的 、 多 层 的 操作 系统 。 
它 使 用 多 层 ， 包 括 硬件 抽象 层 (HAL )、 执 行 层 和 环境 子 系统 层 。 


7.6 练习 
小 测验 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 继续 本 章 习题 前 首先 
完成 相关 测验 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 应 用 程序 和 操作 系统 的 不 同 点 是 什么 ? 

2. 操作 系统 的 组 成 是 什么 ? 

3. 单 道 程序 和 多 道 程 序 之 间 有 何 区 别 ? 

4. 分 页 调度 与 分 区 调度 有 什么 差别 ? 

5. 为 什么 请 求 分 页 调度 比 常规 页 面 调度 更 有 效率 ? 

6. 程序 和 作业 之 间 有 何 联 系 ? 作业 和 进程 之 间 有 何 联 系 ? 程序 和 进程 之 间 的 联系 又 如 何 ? 
7. 程序 驻 留 在 哪里 ? 作业 驻 留 在 哪里 ?进程 驻 留 在 哪里 ? 

8. 作业 调度 器 和 进程 调度 器 有 什么 区 别 ? 

9. 为 什么 操作 系统 需要 队列 ? 

10. 死 锁 和 饿 死 有 何 区 别 ? 


练习 题 


1. 一 个 计算 机 装 有 一 个 单 道 程序 的 操作 系统 。 如 果 内 存 容量 为 64 MB ， 操 作 系统 需要 4 MB 内 存 ， 那 
么 该 计算 机 执行 一 个 程序 可 用 的 最 大 内 存 为 多 少 ? 

2. 若 操作 系统 自动 分 配 10 MB 内 存 给 数据 ， 重 做 第 1 题 。 

.一 个 单 道 程序 的 操作 系统 执行 程序 时 平均 访问 CPU 要 10 微 秒 ， 访 问 IO 设备 要 70 微 秒 ，CPU 空闲 
时 间 为 百 分 之 多少 ? 

. 一 个 多 道 程 序 的 操作 系统 用 一 个 适当 的 分 配 计 划 把 60 MB 内 存 分 为 10 MB、12 MB 、18 MB 、20 MB。 

第 一 个 程序 运行 需要 17 MB 内 存 ， 使 用 了 第 三 分 区 。 第 二 个 程序 运行 需要 8 MB 内 存 ， 使 用 了 第 一 

分 区 。 第 三 个 程序 运行 需要 10.5 MB ， 使 用 了 第 二 分 区 。 最 后 ， 第 四 个 程序 运行 需要 20 MB 内 存 ， 

使 用 了 第 四 分 区 。 那 么 总 共 使 用 了 多 少 内存 ? 总 共 浪 费 了 多 少 内 存 ? 内 存 的 浪费 率 是 多 少 ? 

如 果 所 有 的 程序 都 需要 10 MB 内 存 ， 重 做 第 4 题 。 

一 个 多 道 程序 的 操作 系统 使 用 分 页 调度 。 可 用 内 存 为 60 MB， 分 为 15 个 帧 ， 每 一 帧 大 小 为 4 MB。 

第 一 个 程序 需要 13 MB ， 第 二 个 程序 需要 12 MB ， 第 三 个 程序 需要 27 MB。 

a. 第 一 个 程序 需要 用 到 多 少 帧 ? b. 第 二 个 程序 需要 用 到 多 少 帧 ? 


Lo 
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c. 第 三 个 程序 需要 用 到 多 少 帧 ? d. 有 多 少 个 帧 没有 用 到 ? 
e. 总 共 浪 费 的 内 存 是 多 少 ? f. 内 存 的 浪费 率 是 多 少 ? 


.一 个 操作 系统 使 用 的 虚拟 内 存 ， 但 执行 的 时 候 需 要 所 有 的 程序 驻 留 在 物理 内 存 中 (没有 分 页 调度 或 
分 段 调度 )。 物 理 内 存 大 小 为 100 MB， 虚 拟 内 存 为 1 GB。 有 和 多少 10 MB 大 小 的 程序 可 以 同时 运 
行 ? 它们 之 中 有 多 少 可 以 随时 驻 留 在 内 存 中 ? 多 少 则 必须 要 存在 磁盘 里 ? 


-+ 


8. 进程 在 下 面 的 情况 下 处 于 什么 状态 ? 
a. 进程 在 使 用 CPU b. 进程 结束 打印 ， 等 待 CPU 再 次 调用 
c. 进程 因为 时 间 片 用 尽 而 被 终止 d. 进程 从 键盘 读 取 数 据 
e. 进程 打印 数据 


9. 三 个 进程 (A、B 和 C) 同时 运行 ， 进 程 A 占用 Filel 但 需要 File2。 进 程 B 占用 File3 但 需要 Filel。 
进程 C 占用 File2 但 需要 File3。 为 这 几 个 进程 画 一 个 框图 。 这 种 情况 是 不 是 死 锁 ? 
10. 三 个 进程 (A、B 和 C) 同时 运行 ， 进 程 A 占 有 Filel1， 进 程 B 占有 File2 但 需要 Filel， 进 程 C 占 
有 File3 但 需要 File2。 为 这 几 个 进程 画 一 个 框图 。 这 种 情况 是 不 是 死 锁 ? 如 果 不 是 ， 说 明 进 程 怎样 
最 后 完成 它们 的 任务 。 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通 过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨论 材料 的 理解 。 
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本 章 首 先 介绍 算法 的 概念 ， 算 法 即 分 步骤 解决 问题 的 过 程 。 然 后 讨论 那些 用 来 开发 算法 
的 工具 。 最 后 ， 列 举 一 些 常见 的 迭代 和 递归 算法 例子 。 
目标 
通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 
。 定义 算法 ， 并 与 问题 求解 关联 ; 
定义 三 种 结构 顺序、 选择 和 循环 )， 并 描述 它们 在 算法 中 的 作用 ; 
描述 UML 图 和 当 表 示 算 法 时 它们 是 如 何 使 用 的 ; 
描述 伪 代码 和 当 表示 算法 时 它们 是 如 何 使 用 的 ; 
列 出 基本 算法 和 它们 的 应 用 ; 
描述 排序 的 概念 ， 理 解 三 种 原始 排序 算法 背后 的 机 制 ; 
描述 搜索 的 概念 ， 理 解 两 种 常见 搜索 算法 背后 的 机 制 ; 
定义 子 算法 和 它们 与 算法 的 关系 ; 
区 分 迭代 和 递归 算法 。 


8.1 概念 
本 节 将 给 出 算法 的 非 正式 定义 ， 然 后 通过 一 个 例子 来 详细 讲述 算法 的 概念 。 


8.1.1 非 正式 定义 


算法 一 种 非 正 式 的 定义 如 下 : 

算法 是 一 种 逐步 解决 问题 或 完成 任务 的 方法 。 

按照 这 种 定义 ， 算 法 完全 独立 于 计算 机 系 输入 数据 
统 。 更 特别 的 是 ， 还 应 该 记 住 算 法 接收 一 组 输 算法 


入 数据 ， 同 时 产生 一 组 输出 数据 (图 8-1 )。 
分 步骤 方法 


1. 示例 

下 面 用 一 个 例子 来 对 这 种 简单 的 定义 进行 
分 析 。 我 们 要 生成 从 一 组 正 整数 中 找到 最 大 整 输出 数据 
数 的 一 个 算法 。 这 个 算法 应 该 能 从 一 组 任意 整 图 8-1 计算 机 中 用 到 的 关于 算法 的 非 正 式 定义 
数 (5、1000、10 000、1 000 000 等 ) 中 找 出 其 最 大 值 。 这 个 算法 必须 具有 通用 性 并 与 整数 
的 个 数 无 关 。 

很 明显 ， 要 完成 从 许多 整数 (例如 ，100 万 个 ) 中 找到 最 大 值 的 这 个 任务 不 可 能 (由 一 
个 人 或 一 台 计算 机 ) 只 用 一 步 完 成 。 算 法 必须 一 个 个 地 测试 每 一 个 整数 。 

要 解决 这 个 问题 ， 可 以 用 一 种 直接 的 方法 。 先 用 一 组 少量 的 整数 (例如 5 个 )， 然 后 将 这 
种 解决 方法 扩大 到 任意 多 的 整数 。 其 实 对 5 个 整数 所 采取 的 解决 方法 的 原理 和 约束 条 件 与 
对 1 000 个 或 1 000 000 个 整数 采取 的 是 一 样 的 。 可 以 假设 ， 即 使 是 5 个 整数 的 例子 ， 算法 也 
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必须 一 个 接 一 个 地 处 理 那 些 整数 。 看 到 第 一 个 整数 ， 并 不 知道 剩 下 的 整数 的 值 。 等 处 理 完 第 
一 个 整数 ， 算 法 才 开 始 处 理 第 二 个 整数 ， 依 (12 8 13 9 11) 输入 数据 

次 进行 。 图 8-2 展示 了 解决 这 个 问题 的 一 种 
方法 。 

我 们 称 这 个 算法 为 求 最 大 值 算法 。 每 个 
算法 都 有 自己 不 同 于 其 他 算法 的 名 字 。 这 个 
算法 接收 一 组 5 个 整数 作为 输入 ， 然 后 输出 
其 中 的 最 大 值 。 

2. 输入 

这 个 算法 需要 输入 一 组 的 5 个 整数 。 

3. 过 程 

在 这 个 算法 中 为 求 最 大 值 采取 了 下 面 5 
个 步骤 : 

(1 ) 第 一 步 求 最 大 值 

在 这 一 步 中 ， 算 法 首先 检查 第 一 个 整数 
(12 )。 因 为 还 没有 检查 其 他 的 整数 (第 一 步 cn lb ene 
只 检查 了 第 一 个 整数 ， 其 他 的 会 在 以 后 检查 )， 所 以 当前 的 最 大 值 (到 目前 为 止 ) 就 是 第 一 个 
整数 。 算 法 中 定义 了 一 个 称 为 Largest 的 变量 ， 并 把 第 一 个 整数 ( 12 ) 赋 给 了 它 。 

(2 ) 第 二 步 

目前 的 最 大 整数 是 12, 但 新 的 数字 可 能 会 成 为 新 的 Largest。 算 法 把 上 一 步 得 到 的 
Largest ( 即 12 ) 和 第 二 个 整数 (8 ) 比较 。 发 现 目 前 的 Largest 大 于 第 二 个 整数 ， 也 就 是 说 ， 
Largest 还 是 最 大 值 ， 不 需要 改变 。 

(3 ) 第 三 步 

目前 的 最 大 整数 还 是 12， 但 是 新 的 整数 ( 13 ) 大 于 Largest。 这 就 意味 着 目前 Largest 
的 值 是 无 效 的 ， 而 应 该 由 第 三 个 整数 (13 ) 代替 。 算 法 把 13 赋 给 Largest， 然 后 进入 下 
一 步 。 

(4) 第 四 步 

该 步 中 最 大 整数 并 未 有 改变 ， 因 为 当前 Largest 比 第 四 个 整数 (9 ) 大 。 

(5 ) 第 五 步 

该 步 中 最 大 整数 并 未 有 改变 ， 因 为 当前 Largest 比 第 五 个 整数 ( 11 ) 大 。 

(6) 输出 

因为 已 经 没有 其 他 数 需要 处 理 ， 所 以 算法 输出 的 Largest 值 是 13。 


8.1.2 定义 动作 

图 8-2 并 没有 说 明 每 一 步 究竟 做 了 什么 工作 。 可 以 改变 测试 数据 了 解 更 多 的 细节 。 例 
如 ， 第 一 步 ， 把 Largest 设 为 第 一 个 整数 的 值 。 第 二 步 到 第 五 步 ， 依 次 把 当前 处 理 的 整数 与 
Largest 的 值 进行 比较 。 如 果 当 前 整数 大 于 Largest， 则 把 它 赋 给 Largest (图 8-3 ) 。 
8.1.3 细 化 

为 了 使 算法 能 在 所 有 的 程序 中 应 用 ， 还 需要 进行 细 化 。 现 在 有 两 个 问题 ， 首 先 ， 第 一 步 





Largest IE 国 P s T 13 T 9 T 1 | 列表 
步骤 1 

Largest 到 [3 | 9 | 17 ] 列 表 
步 又 2 

Largest EE [2 T 5 本 E 9 TI |] 列表 
步骤 3 

Largest [2 T 8 T 1 了 三 1 | 列表 
步 又 4 


Largest EE [12 [8 |[ 13 [| 9 醒 0 用 列表 
步 又 5 
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中 的 动作 与 其 他 步骤 中 不 一 样 。 其 次 ,第 二 步 到 第 五 步 中 的 程序 描述 语言 不 同 。 我 们 只 要 很 
简单 地 改进 一 下 算法 就 可 解决 以 上 两 个 问 
题 。 把 第 二 步 到 第 五 步 的 程序 段 都 写成 
“如 果 当 前 整数 大 于 Largest， 那 么 当前 整 
数 就 成 为 Largest”。 第 一 步 不 同 于 其 他 步 
是 因为 那 时 Largest 还 没有 初始 化 。 如 果 开 
始 就 把 Largest 初始 化 成 -< 〈 负 无 穷 )， 那 
么 第 一 步 就 可 写成 和 其 他 步 一 样 ， 所 以 。 增 
加 一 个 新 的 步骤 ， 可 称 为 第 0 步 ， 也 就 是 表 
明 它 要 在 处 理 任何 其 他 整数 之 前 完成 。 

图 8-4 显示 了 改进 后 的 程序 步骤 。 因 
为 步骤 都 是 一 样 的 ， 所 以 做 了 省 略 。 


8.1.4 泛 化 


可 以 把 这 个 算法 泛 化 吗 ? 假使 要 从 nn 
个 正 数 数 中 找到 最 大 值 ,n 的 值 可 能 是 1 000 或 1 000 000， 或 者 更 多 。 当 然 ， 可 以 按照 图 8-4 
所 示 那 样 重复 每 一 步 。 但 是 如 果 为 程序 改变 算法 ， 就 必须 编写 n 步 操作 ! 


(12 8 13 9 11) 输入 数据 


(12 8 13 9 11) 输入 数据 





(13 ) 输出 数据 
图 8-3 定义 求 最 大 值 算法 的 动作 





(13) 输出 数据 
图 8-4 求 最 大 值 算法 的 细 化 


有 一 种 更 好 的 方法 可 以 改进 它 。 只 要 让 计算 机 循环 这 个 步骤 次 ! 现在 我 们 已 经 在 算法 
图 形 表示 (图 8-5 ) 中 包括 了 这 个 特性 。 


输入 数据 (n 个 整数 ) 


重复 一 下 步骤 0 次 : 





最 大 值 
图 8-5 求 最 大 值 算法 的 泛 化 
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8.2 三 种 结构 

计算 机 专家 为 结构 化 程序 或 算法 定义 了 三 种 结构 。 这 种 想法 认为 程序 必定 是 由 顺序 、 判 
断 (选择 ) 和 循环 (图 8-6 ) 这 三 种 结构 组 成 。 已 经 证 实 其 他 结构 都 是 不 必要 的 。 仅 仅 使 用 
这 三 种 结构 就 可 以 使 程序 或 算法 容易 理解 、 调 试 或 修改 。 


执行 操作 1 





执行 操作 


a) 顺序 





8.2.1 顺序 

第 一 个 结构 称 为 顺序 结构 。 算 法 (最 终 是 程序 ) 都 是 指令 序列 。 它 可 以 是 一 简单 指令 或 
是 其 他 两 种 结构 之 一 。 
8.2.2 判断 


有 些 问 题 只 用 简单 的 指令 序列 是 不 能 够 解决 的 。 有 时 候 需 要 检测 一 个 条 件 是 否 满 足 。 假 
如 测试 的 结果 为 真 ， 则 可 以 继续 顺序 往 下 执行 指令 ; 假如 结果 为 假 ， 程 序 将 从 另外 一 个 顺序 
结构 的 指令 继续 执行 。 这 就 是 所 谓 的 判断 〈 选 择 ) 结构 。 


8.2.3 循环 

在 有 些 问题 中 ， 相 同 指令 序列 需要 重复 。 可 以 用 重复 或 循环 结构 来 解决 这 个 问题 。 从 指 
定 的 整数 集中 求 最 大 整数 的 算法 就 是 这 种 结构 的 。 
8.3 算法 的 表示 

到 目前 为 止 ， 我 们 已 经 使 用 图 来 表示 算法 的 基本 概念 。 在 最 近 几 十 年 中 ， 还 出 现 了 其 他 
见 种 用 来 表示 算法 的 工具 。 这 里 将 介绍 UML 和 伪 代码 这 两 种 工具 。 
8.3.1 UML 


统一 建 模 语言 (UML) 是 算法 的 图 形 表示 法 。 它 使 用 “大 图 ”的 形式 掩盖 了 算法 的 所 有 
细节 ， 它 只 显示 算法 从 开始 到 结束 的 整个 流程 。 

在 附录 B 中 有 UML 的 具体 说 明 。 这 里 只 给 出 三 种 结构 的 UML 表示 (图 8-7 ) 。 注 意 ， 
UML 具有 许多 灵活 性 ， 正 如 附录 B 中 所 展示 的 。 如 果 在 假 的 部 分 没有 操作 ， 那 么 判断 结构 
就 能 简化 。 


8.3.2 ” 伪 代 码 


伪 代 码 是 算法 的 一 种 类 侯 英 语 的 表示 法 。 现 在 还 没有 伪 代 码 的 标准 。 有 些 人 使 用 得 过 
细 ， 有 些 人 则 使 用 得 过 粗 。 有 些 人 用 一 种 很 像 英语 的 代码 ， 有 些 人 则 用 和 Pascal 编程 语言 相 
似 的 语法 。 在 附录 C 中 有 伪 代 码 的 具体 说 明 。 这 里 只 演示 伪 代 码 是 如 何 表示 三 种 结构 的 〈 如 
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图 8-8 所 示 )。 





图 8-7 三 种 结构 的 UML 


Ee (条 件 ) 
Mh 





a) 顺序 b) 判断 c) 循环 
图 8-8 用 伪 代码 表示 三 种 结构 


例 8.1 用 伪 代 码 写 出 求 两 个 整数 之 和 的 算法 。 
解 ”这 个 简单 的 问题 只 要 用 顺序 结构 就 可 以 解决 。 注 意 ， 同 时 还 给 该 算法 命名 ， 定 义 算 
法 的 输入 ， 并 在 结尾 用 一 条 返回 指令 来 返回 和 。 


算法 8.1 计算 两 个 整数 之 和 


算法 : SumOfTwo (first，second) 
目的 : 求 两 整数 之 和 
前 提 : 给 定 两 个 整数 (first 和 second) 
后 续 : 无 
返回 : 和 的 值 
{ 
sum <— first + second 
return sum 
} 


例 8.2 编写 可 以 把 一 组 不 同 的 成 绩 分 成 及 格 或 不 及 格 的 算法 。 

解 这 个 问题 如 果 仅 用 顺序 结构 将 无 法 完成 ， 另 外 还 需要 判断 结构 。 计 算 机 给 出 
0 一 100 之 间 的 一 个 数 ， 如 果 这 个 数 大 于 或 等 于 70 则 返回 “及 格 ”(pass)， 如 果 小 于 70 则 返 
回 “ 不 及 格 ” (nopass)。 算法 8.2 给 出 了 该 算法 的 伪 代 码 表示 。 


算法 8.2 及格/ 不 及 格 分 级 


算法 : Pass/NoPass (score) 

目的 : 给 定 分数 ， 创建 及 格 / 不 及 格 等 级 
前 提 : 给 定 要 被 改 成 等 级 的 分 数 

后 续 : 无 
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返回 : 等 级 

{ 
if (score 二 70) grade 人 一 "pass" 
else grade + "nopass" 
return grade 

} 


例 8.3 ”编写 将 数字 型 成 绩 (整数 ) 变 为 字母 等 级 成 绩 的 算法 。 

解 ” 这 个 问题 需要 多 个 判断 。 算 法 8.3 中 的 伪 代码 显示 的 是 一 种 解决 方法 〈 并 不 是 最 好 
的 方法 ， 但 却 是 最 容易 理解 的 方法 )。 同 样 ， 计 算 机 给 出 0 ~ 100 之 间 的 一 个 任意 数 ， 算 法 
必须 把 它 划 分 到 正确 的 字母 等 级 中 去 (A、B、C、D 或 F)。 


算法 8.3 ”赋予 字母 等 级 成 绩 
算法 : LetterGrade (score) 
目的 : 给 定 分 数 ， 找 到 相应 字母 等 级 


前 提 : 给 定数 字 分 数 

后 续 : 无 

返回 : 字母 等 级 

{ 
if (100 过 score 二 90) grade 二 和 RAI 
if (89 二 Score 二 80) grade 二 'B!' 
if (79 二 score 二 70) grade  'C' 
if (69 过 score 三 60) grade *- 1D' 
if (59 score 二 0) grade 全 !F' 


return grade 
} 


注意 : 这 里 计 语 句 不 需要 else 语句 ， 因 为 如 果 条 件 不 成 立 并 不 需要 做 什么 。 
例 8.4 编写 从 一 组 整数 中 求 最 大 数 的 算法 ,该 组 整数 的 数目 事先 并 不 知道 。 
解 ” 使 用 图 8-5 中 介绍 的 概念 编写 出 解决 该 问题 的 算法 ( 见 算 法 8.4 )。 


算法 8.4 ” 求 一 组 整数 中 的 最 大 数 
算法 ; FindLargest (1ist) 
目的 : 求 一 组 整数 中 的 最 大 值 
前 提 : 给 定 一 组 整数 
后 续 : 无 
返回 : 最 大 整数 


largest 全 -~ 
while (more integers to check) 
{ 
, Current «~ nextinteger 
if (current > largest) largest 一 current 


} 
return largest 


} 

例 8.5 写 从 一 组 整数 前 1 000 个 整数 中 求 最 小 值 的 算法 。 

解 ”这 里 需要 一 个 计数 器 用 来 计数 。 把 这 个 计数 器 初始 化 为 1， 每 循环 一 次 就 对 它 加 1。 
当 计数 器 大 于 1 000 时 ， 退 出 循环 (参见 算法 8.5 ) 。 注 意 ， 列 表 中 有 超过 1000 个 整数 ， 但 
我 们 需要 求 前 1000 个 整数 中 的 最 小 值 。 
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算法 8.5 ” 求 前 1 000 个 整数 中 的 最 小 整数 
算法 : FindsSmallest (list) 
目的 : 求 前 1000 个 整数 中 的 最 小 整数 ， 并 返回 
前 提 : 给 定 一 组 超过 1000 个 整数 
后 续 : 无 
返回 : 最 小 整数 


SmalLlLest 一 二 co 

Countez 一 工 

while (Countez 1000) 

4 
Current *— next integer 
if (current<smallest) 
smallest «+ current 
Counter + counter+l1 

} 

return smallest 


} 


8.4 更 正式 的 定义 
he ll 下 面 闪 出 算 忽 更 为 正式 的 竺 淆 





下 面 详细 解释 一 下 这 个 定义 。 
8.4.1 定义 良好 

算法 必须 是 一 组 定义 良好 且 有 序 的 指令 集合 。 
8.4.2 ”明确 步骤 

算法 的 每 一 步 都 必须 有 清晰 、 明 白 的 定义 。 如 某 一 步 是 将 两 整数 相 加 ， 那 么 必须 定义 相 加 
的 两 个 整数 和 加 法 符号 ， 相 同 的 符号 不 能 在 某 处 用 作 加 法 符号 ， 而 在 其 他 地 方 用 作 乘法 符号 。 
8.4.3 ”产生 结果 

算法 必须 产生 结果 ， 否 则 该 算法 就 没有 意义 。 结 果 可 以 是 返回 给 调用 算法 的 数据 或 其 他 
效果 (如 打印 )。 
8.4.4 在 有 限 的 时 间 内 终止 

算法 必须 能 够 终止 (停机 )。 如 果 不 能 (例如 ， 无 限 循环 )， 说明 不 是 算法 。 第 17 章 将 讨 
论 可 解 问题 与 不 可 解 问 题 。 你 将 会 看 到 ， 可 解 问题 的 解法 形式 为 一 个 可 终止 的 算法 。 
8.5 ”基本 算法 


有 一 些 算法 在 计算 机 科学 中 应 用 非常 普遍 ， 我 们 称 之 为 “基本 ”算法 。 这 里 将 讨论 一 些 
最 常用 的 算法 。 讨 论 只 是 概括 性 的 ， 具体 的 实现 则 取决 于 采用 何 种 语言 。 


8.5.1 求 和 
计算 机 科学 中 经 常用 到 的 一 种 算法 是 求 和 。 你 可 以 容易 地 实现 两 个 或 三 个 整数 的 相 加 ， 


154 谢 8 葬 


但 是 怎样 才能 实现 一 系列 整数 相 加 呢 ? 答案 很 简单 : 在 循环 中 使 用 加 法 操作 ( 见 图 8-9 )。 
求 和 算法 可 分 为 三 个 逻辑 部 分 : 
1 ) 将 和 (sum) 初始 化 。 
2 ) 循环 ， 在 每 次 迭代 中 将 一 个 新 数 加 到 和 (sum) 上 。 
3 ) 退出 循环 后 返回 结果 。 


8.5.2 ”乘积 


另 一 个 常用 算法 是 求 出 一 系列 整数 的 乘积 。 方 法 也 很 简单 : 在 循环 中 使 用 乘法 操作 ( 见 
图 8-10 )。 乘 法 算法 有 三 个 逻辑 部 分 : 

1 ) 将 乘积 (product) 初始 化 。 

2 ) 循环 ， 在 每 次 迭代 中 将 一 个 新 数 与 乘积 (product) 相 乘 。 

3 ) 退出 循环 后 返回 结果 。 





current <— next integer 
product <— productx current 





CUITent <— next integer 











图 8-9 求 和 算法 图 8-10 乘积 算法 


例如 ， 上 面 的 算法 通过 较 小 的 改动 可 以 用 来 计算 x"( 留 作 练 习 )。 另 一 个 例子 ， 即 采用 
同样 的 算法 可 以 实现 整数 的 阶乘 运算 。 这 个 将 在 本 章 后 面 介绍 。 


8.5.3 ”最 大 和 最 小 


本 章 开 头 讨 论 了 求 一 组 整数 中 最 大 值 的 算法 。 它 的 思想 是 通过 一 个 判断 结构 求 到 两 个 数 
中 的 较 大 值 。 如 果 把 这 个 结构 放 在 循环 中 ， 就 可 以 求 出 一 组 数 中 的 最 大 值 。 

求 一 组 整数 中 最 小 值 和 上 面 的 方法 相似 ， 只 有 两 个 小 小 的 不 同 。 首 先 ， 用 判断 结构 求 出 
两 个 整数 中 的 较 小 值 。 其 次 ， 在 初始 化 时 使 用 一 个 很 大 的 而 不 是 非常 小 的 整数 。 


8.5.4 排序 


计算 机 科学 中 的 一 个 最 普遍 应 用 是 排序 ， 即 根据 数据 的 值 对 它们 进行 排列 。 人 们 的 周 
围 充 满 了 数据 ， 如 果 这 些 数 据 都 是 无 序 的 ， 可 能 会 花 很 多 时 间 去 查找 一 条 简单 信息 。 想 象 一 
下 ， 在 一 个 没有 排序 的 电话 本 中 查找 某 人 的 电话 号 码 是 多 么 困难 的 一 件 事 。 

本 节 将 介绍 三 种 排序 算法 : 选择 排序 、 冒 泡 排 序 、 插 入 排序 。 这 三 种 方法 是 当今 计算 机 
科学 中 使 用 的 快速 排序 的 基础 。 
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1. 选择 排序 

在 选择 排序 中 ， 数 字 列 表 可 分 为 两 个 子 列表 (已 排序 的 和 未 排序 的 )， 它 们 通过 假想 的 
一 堵 墙 分 开 。 求 未 排序 子 列 表 中 最 小 的 元 素 并 把 它 和 未 排序 子 列表 中 第 一 个 元 素 进行 交换 ， 
经 过 每 次 选择 和 交换 ， 两 个 子 列表 中 假想 的 这 堵 墙 向 前 移动 一 个 元 素 ， 这 样 每 次 排序 列表 中 
将 增加 一 个 元 素 而 未 排序 列表 中 将 减少 一 个 元 素 ， 每 次 把 一 个 元 素 从 未 排序 列表 移 到 已 排序 
列表 就 完成 了 一 轮 排序 。 一 个 含有 个 元 素 的 数字 列表 需要 n-1 轮 排序 来 完成 数据 的 重新 排 
列 。 选 择 排序 的 流程 图 如 图 8-11 所 示 。 





图 8-11 选择 排序 
图 8-12 给 出 了 对 6 个 整数 进行 排序 的 步骤 。 








图 8-12 选择 排序 示例 


该 图 显示 出 了 在 排序 列表 和 未 排序 列表 之 间 的 那 堵 墙 在 每 轮 中 是 如 何 移动 的 。 仔 细 体 会 
该 图 ， 就 可 以 看 到 经 过 5 轮 后 完成 对 列表 的 排序 ， 轮 数 比 该 列表 中 元 素 的 个 数 少 1。 因 此 ， 
如 果 使 用 循环 控制 排序 ， 那 么 循环 的 次 数 是 列表 中 的 元 素 个 数 减 1。 

选择 排序 算法 

该 算法 使 用 两 重 循环 ， 外 层 循 环 每 次 扫描 时 和 迭 代 一 次 ， 内 层 循 环 在 未 排序 列表 中 求 最 小 
的 元 素 。 图 8-13 给 出 了 选择 排序 算法 的 UML 图 ， 内 层 循环 在 图 中 并 没有 明显 地 显示 出 来 ， 
但 循环 中 的 第 一 条 指令 本 身 就 是 一 个 循环 。 我 们 把 循环 的 演示 留 给 读者 作为 练习 。 

2. 冒 泡 排序 

在 冒 泡 排序 方法 中 ， 数 字 列表 被 分 为 两 个 子 列 表 : 已 排序 的 和 未 排序 的 。 在 未 排序 子 列 
表 中 ， 最 小 的 元 素 通过 冒 泡 的 方法 选 出 来 并 移 到 已 排序 子 列 表 中 。 当 把 最 小 的 元 素 移 到 已 排 
序列 表 后 ， 墙 向 前 移动 一 个 元 素 ， 使 得 已 排序 元 素 的 个 数 增加 1 个 ， 而 未 排序 元 素 的 个 数 减 
少 1 个。 每 次 元 素 从 未 排序 子 列表 中 移 到 已 排序 子 列表 中 ， 便 完成 一 轮 ( 见 图 8-14 )。 一 个 
含有 个 元 素 的 列表 ， 冒 泡 排 序 需要 n-1 轮 来 完成 数据 排序 。 

图 8-15 给 出 了 每 一 轮 后 墙 移动 一 个 元 素 的 过 程 。 第 一 轮 ， 从 56 开始 并 把 它 与 32 比较 ， 
因为 它 不 小 于 32 所 以 墙 没 有 被 移动 。 继 续 下 一 个 元 素 ， 都 未 发 生变 化 直到 45 和 8 进行 比 
较 ， 由 于 8 比 45 小 ， 这 两 个 元 素 进行 位 置 交换 。 继 续 下 一 个 元 素 ， 因 为 8 向 后 移动 一 个 元 
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素 ， 所 以 它 现在 和 78 比较 ， 显 然 这 两 个 元 素 需 交换 位 置 。 最 后 ，8 和 23 比较 并 交换 位 置 。 
经 过 一 系列 交换 ，8 被 放置 在 第 一 个 位 置 ， 并 且 墙 向 前 移动 了 1 个 位 置 。 这 个 算法 就 是 因 其 
中 数字 (这 个 例子 中 的 8 ) 向 表 的 开始 或 项 部 移动 的 方式 就 像 水 泡 从 水 中 冒 出 的 样子 而 得 名 。 





在 列表 最 左边 设置 墙 


这 涉及 另 一 个 循环 - 


图 8-13 ”选择 排序 算法 





图 8-14 冒 泡 排 序 


注意 ， 在 墙 到 达 列 表 末尾 之 前 ， 我 们 已 经 停止 了 ， 因 为 列表 已 经 是 有 序 的 。 我 们 总 是 
能 在 算法 中 包含 一 个 指示 器 ， 如 果 在 一 轮 中 没有 数据 交换 ， 那 就 停止 按 轮 排序 。 通 过 减少 步 


， 数 ， 这 个 事实 能 用 来 改善 冒 泡 排序 的 性 能 。 


中 23T7zs14Ts [321se]| (2317 T41321s6] | ESN 32 T7141s6 
已 排序 
初始 列表 第 1 轮 后 第 2 轮 后 
”2 :| 国 轩 国 
已 排序 已 排序 已 排序 
第 3 轮 后 第 4 轮 后 第 5 轮 后 
图 8-15 冒 泡 排 序 示例 


冒 泡 排 序 在 最 初 被 编写 为 将 列表 中 最 大 元 素 “ 向 下 冒 泡 ”。 从 效率 的 观点 来 看 ， 无 论 是 
大 数 冒 泡 还 是 小 数 冒 泡 并 没有 什么 区 别 。 然 而 ， 从 连贯 性 的 观点 看 ,采用 同一 工作 方式 将 使 
得 在 三 种 排序 方法 之 间 比 较 较 为 容易 。 因 此 我 们 选择 每 轮 对 最 小 值 进行 冒 泡 。 
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冒 泡 排 序 算 法 

冒 泡 排 序 也 使 用 两 重 循环 ， 外 层 循环 每 轮 迭 代 一 次 ; 内 层 循 环 的 每 次 迭代 则 将 某 一 元 素 
冒 泡 至 顶部 ( 左 部 )。 我 们 把 UML 图 和 伪 代 码 留 给 读者 作为 练习 。 

3. 插 人 排序 

插入 排序 是 最 常用 的 排序 技术 之 一 ， 经 常 在 扑克 牌 游戏 中 使 用 。 玩 家 将 每 张 拿 到 的 牌 插 
人 手中 合适 的 位 置 ， 以 便 手 中 的 牌 以 一 定 的 顺序 排列 。( 扑 克 牌 排序 是 一 种 使 用 两 个 标准 进 
行 排序 的 例子 : 匹配 和 等 级 。) 

在 插入 排序 中 ， 和 本 章 中 讨论 的 其 他 两 种 排序 方法 一 样 ， 排 序列 表 被 分 为 两 部 分 : 已 排 
序 的 和 未 排序 的 。 在 每 轮 ， 把 未 排序 子 列表 中 的 第 一 个 元 素 转移 到 已 排序 子 列表 中 ， 并且 插 
人 合适 的 位 置 ( 见 图 8-16 )。 可 以 看 到 ， 一 个 含有 nn 个 元 素 的 列表 至 少 需 要 n-1 轮 排序 。 





图 8-16 插入 排序 


8-17 演示 了 对 列表 中 的 6 个 数 进行 插入 排序 的 过 程 。 每 轮 中 ， 当 从 未 排序 子 列表 中 
删除 一 个 元 素 并 插入 已 排序 子 列表 中 时 墙 便 移动 一 个 元 素 。 

插入 排序 算法 

插入 排序 算法 的 设计 类 似 于 选择 排序 算法 和 冒 泡 排序 算法 的 模式 。 外 层 循环 每 轮 都 迭 
代 ， 内 层 循环 则 寻找 插入 的 位 置 。 我 们 将 UML 图 和 伪 代 码 留 给 读者 作为 练习 。 


ETT lad] Niel 2 
“| 克 四 器 加 加 2 | 四 |: i BE 


初始 列表 
-一 | 
i 


图 8-17 es 


4. 其 他 排序 算法 

这 里 讨论 的 三 种 排序 算法 是 效率 最 低 的 排序 算法 ， 如 果 要 排序 的 列表 中 有 多 于 几 百 个 元 
素 ， 那 么 不 应 该 使 用 这 些 算 法 。 在 这 里 讨论 这 些 算法 只 是 出 于 学 习 的 目的 ， 但 它们 不 实用 。 
在 一 本 导论 书 中 讨论 这 些 排 序 算法 有 几 个 原因 : 

e 它们 是 最 简单 的 算法 ， 容 易 理解 和 分 析 。 

e 它们 是 更 高 效 算法 的 基础 ， 如 快速 排序 、 堆 排序 、Shell 排序 、 桶 式 排序 、 合 并 排序 、 

基 排 序 等 。 
大 多 数 这 些 高 级 排序 算法 在 本 书 关于 数据 结构 的 内 容 中 有 讨论 。 
为 什么 会 有 这 么 多 的 排序 算法 ? 原因 就 在 于 需要 排序 的 数据 的 类 型 。 一 种 算法 对 部 分 排 
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序 的 数据 很 有 效 ， 而 另 一 种 算法 对 完全 未 排序 的 数据 很 有 效 。 为 了 决定 哪 种 算法 更 适合 特定 
的 程序 ， 需 要 一 种 叫做 算法 复杂 度 的 度量 。 第 17 章 将 讨论 这 个 问题 ,但 是 彻底 理解 则 需要 
学 习 程序 设计 和 数据 结构 方面 的 额外 课程 。 


8.5.5 查找 


在 计算 机 科学 里 还 有 一 种 常用 的 算法 叫做 查找 ， 是 一 种 在 列表 中 确定 目标 所 在 位 置 的 算 
法 。 在 列表 中 ， 查 找 意味 给 定 一 个 值 ， 并 在 包含 该 值 的 列表 中 找到 第 一 个 元 素 的 位 置 。 对 于 
列表 有 两 种 基本 的 查找 方法 : 顺序 查找 和 折 半 查找 。 顺 序 查 找 可 以 在 任何 列表 中 查找 ， 折 半 
查找 则 要 求 列表 是 有 序 的 。 

1. 顺序 查找 

顺序 查找 用 于 查找 无 序列 表 。 一 般 来 说 ， 可 以 用 这 种 方法 来 查找 较 小 的 列表 或 不 常用 的 
列表 。 其 他 情况 下 ， 最 好 的 方法 是 首先 将 列表 排序 ， 然 后 使 用 后 面 将 要 介绍 的 折 半 查找 进行 
查找 。 

顺序 查找 是 从 列表 起 始 处 开始 查找 ， 当 找到 目标 元 素 或 确信 查找 目标 不 在 列表 中 时 ， 查 
找 过 程 结束 。 图 8-18 演示 了 查找 数值 62 的 步 又。 查找 算 法 需要 被 设计 成 : 当 找 到 目标 或 到 


达 列 表 未 尾 时 算法 就 停止 。 


1 2 3 4 5 6 7 8 9 10 11 12 


Fala TsTu ls T2277| ell | 
1 2 3 4 5 6 7 8 9 10 11 12 
EE 了 "TsT2T7 TafT7Tio 


1 2 3 4 5 6 7 8 9 10 11 12 


[4|213|14 本 洒 "| s| 2|7 sl7lno 





2 3 4 5 6 7 8 11 12 


1 9 10 
[4|21|361 4 本 ?9 | s | 21| 7 | sl7| | 





1 2 3 4 5 6 7 8 9 10 11 12 
[4|2|a|1 本 "| si|22| 7 |sl7lano 
图 8-18 顺序 查找 示例 
2. 折 半 查找 
顺序 查找 算法 是 很 慢 的 。 如 果 列 表 里 有 100 万 个 元 素 ， 在 最 坏 的 情况 下 需要 进行 100 万 
次 比较 。 如 果 这 个 列表 是 无 序 的 ， 则 顺序 查找 是 唯一 的 方法 。 如 果 这 个 列表 是 有 序 的 ， 那 么 
就 可 以 使 用 一 个 更 有 效率 的 方法 ， 称 为 折 半 查找 。 一 般 来 说 ， 程 序 员 在 列表 很 大 时 使 用 折 半 
查找 。 | 
折 半 查找 是 从 一 个 列表 的 中 间 元 素来 测试 的 ， 这 将 能 够 判别 出 目标 在 列表 的 前 半 部 分 还 
是 后 半 部 分 。 如 果 在 前 半 部 分 ， 就 不 需要 查找 后 半 部 分 。 如 果 在 后 半 部 分 ， 就 不 需要 查找 前 
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半 部 分 。 换 名 话说 ， 可 以 通过 判断 减少 一 半 的 列表 。 

重复 这 个 过 程 直 到 找到 目标 或 者 目标 不 在 这 个 列表 里 。 图 8-19 给 出 了 如 何在 12 个 数字 
的 列表 中 找到 目标 22， 其 中 使 用 了 三 个 引用 : first、mid 、last。 | 

1 ) 开始 时 ，first 为 1，last 为 12。 使 mid 在 中 间 位 置 , (1+12 ) /2 或 6。 现 在 比较 目标 
( 22 ) 与 在 位 置 6 的 数 (21 )。 目 标 比 它 大 ， 所 以 忽略 前 半 部 分 。 

2 ) 将 first 移动 到 mid 的 后 面 ， 即 位 置 7。 使 mid 在 第 二 个 一 半 的 中 间 , (7+12)/2 或 9。 
现在 比较 目标 (22 ) 与 位 置 9 的 数 ( 62 )。 目 标 比 它 小 ， 所 以 忽略 ( 62 ) 以 后 的 数 。 

3 ) 将 last 移动 到 mid 的 前 面 ， 即 位 置 8。 重 新 计算 mid 为 (8+7)/2 或 7。 比 较 目 标 
(22 ) 与 位 置 7 的 数 (22 )。 由 于 找到 了 目标 ， 此 时 算法 结束 。 


给 定 目 标 (22 ) ; 要 查找 的 位 置 (7 ) 





六 
1 


YY 
2 3 4 5 6 7 8 9 10 11 12 
[L4|17|1s|10| 1 本 2 呈 22|3| 0 7| sl| 9 





折 半 查找 算法 需要 设计 成 : 找到 元 素 或 如 果 目 标 不 在 列表 中 算法 停止 。 从 这 个 算法 也 能 
看 出 : 当 目 标 不 在 列表 中 时 ，last 的 值 就 变 成 小 于 first 的 值 ， 这 不 正常 的 条 件 让 我 们 知道 什 
么 时 间 退 出 循环 。 


8.6 子 算 法 


根据 在 8.2 节 描 述 过 的 三 种 编程 结构 ， 可 以 为 每 一 个 可 解 的 问题 创建 算法 。 结 构 化 编程 的 
原则 要 求 将 算法 分 成 几 个 单元 ， 称 为 子 算法 。 每 个 子 算法 依次 又 分 为 更 小 的 子 算法 。 一 个 好 的 
例子 是 图 8-13 中 的 选择 排序 算法 。 在 未 排序 的 子 列表 中 求 最 小 的 整数 是 一 个 独立 的 任务 ， 它 能 
被 看 成 一 个 子 算法 (图 8-20 )。 在 每 次 迭代 中 ， 算 法 SelectionSort 调用 子 算法 FindSmallest。 
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开始 


调用 求 FindSmallest 
扫描 未 排序 列表 


用 未 排序 列表 的 第 1 
个 元 素 交换 最 小 值 “ 





SelectionSort 算 法 FindSmallest 算 法 


图 8-20 子 算法 的 概念 


使 用 子 算法 至 少 有 两 个 优点 : 


e 程序 更 容易 理解 。 仔 细 查 看 SelectionSort 算法 ， 很 快 便 可 以 发 现任 务 (在 未 排序 列 
表 中 求 最 小 的 整数 ) 重复 执行 了 。 
。 子 算法 可 在 主 算法 中 不 同 地 方 调用 ， 而 无 需 重 写 。 


结构 图 


程序 员 使 用 的 另 一 个 编程 工具 就 是 结构 图 。 结 构图 是 一 种 高 级 设计 工具 ， 它 显示 了 算法 和 
子 算法 之 间 的 关系 。 它 一 般 在 设计 阶段 使 用 ， 而 不 是 在 编程 阶段 。 附 录 D 将 简要 讨论 结构 图 。 


8.7 ”递归 


通常 ， 有 两 种 途径 用 于 编写 解决 问题 的 算法 。 一 种 使 用 迭代 ， 另 一 种 使 用 递归 。 递 归 是 
算法 自我 调用 的 过 程 。 


8.7.1 和 迭代 的 定义 

学 习 一 个 简单 的 例子 ， 考 虑 一 个 阶乘 I ifn-0 
的 计算 。 阶 乘 的 因子 是 从 1 到 该 数 的 整 Factorial (m) = a | 
数 。 和 迭代 的 定义 如 图 8-21 所 示 。 如 果 算 法 人 We 
的 定义 不 涉及 算法 本 身 ， 则 算法 是 迭代 的 。 图 8-21 阶乘 的 迭代 定义 


8.7.2 递归 的 定义 
每 一 个 算法 出 现在 它 本 身 的 定义 中 ， 该 算法 就 是 递归 定义 的 。 例 如 ， 阶 乘 函 数 可 以 如 


章 法 


图 8-22 所 示 递 归 定 义 。 
图 8-23 给 出 了 用 递归 分 解 阶乘 (3 )。 
如 果 仔 细 研 究 该 图 ， 便 会 发 现 递归 解决 问 Factorial (n) = 
题 有 两 条 途径 。 首 先 将 问题 从 高 至 低 进 行 
分 解 ， 然 后 从 低 到 高 解决 它 。 
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1 if n=0 
nxFactorial (n—1) ifn>0 


图 8-22 ”阶乘 的 递归 定义 





Factorial (3) = 3 x Factorial(2) 





Factorial (2) =2x Factorial(1) 


Factorial (1)= 1x Factorial(0) 


Factorial (0) = 1 









Factorial (3) =3 x 2=6 


Factorial (2) =2x 1=2 


Factorial (l)) =1x 1=1 













图 8-23 ”阶乘 问题 的 递归 解决 步骤 


由 这 个 例子 看 ， 似 乎 递归 计算 花费 时 间 更 长 且 更 困难 。 那 为 什么 我 们 要 用 递归 呢 ? 虽然 
递归 在 使 用 笔 和 纸 来 解决 问题 时 看 起 来 很 困难 ， 但 如 果 使 用 计算 机 时 则 变 得 更 简单 和 优美 。 
而 且 ， 递 归 对 于 编程 人 员 和 程序 阅读 者 在 概念 上 容易 理解 。 


1. 迭代 解法 


让 我 们 用 迭代 算法 来 求解 阶乘 问题 。 这 个 算法 通常 包含 一 个 循环 ， 如 算法 8.6 所 示 。 
算法 8.6 ”阶乘 迭代 算法 


法 : Factorial (n) 

: 使 用 循环 求 一 个 整数 的 阶乘 
: 给 定 n 

: 无 


+ 


和 
= 
while(i<n) 
{ 
FE 一 了 XI 
工 (一 工 +1 
} 
return F 


} 


2. 递归 解法 


阶乘 问题 的 递 解法 如 算法 8.7 所 示 。 它 不 需要 循环 ， 


归 算法 里 ， 阶 乘 算 法 调用 自己 。 


但 递归 概念 本 身 包 含 了 重复 。 在 递 


算法 8.7 阶乘 递归 算法 


Factorial (n) 

目的 : 使 用 递归 求 一 个 整数 的 阶乘 
前 提 : 给 定 n 

后 续 : 无 


算法 : 
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油 
oo 
二 


返回 : n ! 


{ 


} 


if (n=0) 

return 1 

else 

return nxXFactorial (n-1) 





8.8 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 


小 结 


Aho, A., Hopcroft, J. and Ullman, J. The design and Analysis of Computer Algorithms, 
Boston, MA: Addison Wesley, 1974 

Cormen, T., Leiserson, C. and Rivest, R. Introduction to Algorithm, New York: McGraw- 
Hill, 2003 

Gries, D. The Science of Programming, New York: Springer, 1998 

Tardos, E. and Kleinberg, J. Algorithm Design, Boston, MA: Addison Wesley, 2006 
Roberts, E. Thinking Recursively, New York: Wiley, 1998 


非 正 式 地 讲 ， 算 法 是 一 步 一 步 解决 问题 或 完成 任务 的 方法 。 更 正式 地 ， 算 法 定义 为 
一 组 明确 步骤 的 有 序 集合 ， 它 产生 结果 并 在 有 限 的 时 间 内 终止 。 

计算 机 科学 家 已 经 为 结构 化 程序 或 算法 定义 了 三 种 结构 : 顺序 、 判 断 〈 选 择 ) 和 重复 
(循环 )。 

有 几 种 工具 能 用 来 表示 算法 : UML、 伪 代码 和 结构 图 。UML 是 算法 的 图 形 化 表 
示 ; 伪 代码 是 算法 类 做 英语 的 表示 ; 结构 图 是 显示 算法 和 子 算法 间 关 系 的 高 级 设计 
工具 。 

在 计算 机 科学 中 ， 有 几 种 算法 得 到 普遍 使 用 ， 以 至 于 它们 被 看 成 是 基本 算法 。 本 章 
讨论 其 中 最 常见 的 算法 : 求 和 、 乘 积 、 求 最 小 值 与 最 大 值 、 排 序 和 查找 。 

在 计算 机 科学 中 ， 最 常见 的 一 种 应 用 就 是 排序 ， 它 是 数据 根据 其 值 的 大 小 进行 排序 
的 过 程 。 我 们 介绍 了 三 种 原始 但 基本 的 排序 算法 : 选择 排序 、 冒 泡 排 序 和 插入 排序 。 
这 三 种 排序 算法 是 如 今 计 算 机 科学 中 快速 排序 的 基础 。 

计算 机 科学 中 另 一 种 常见 的 算法 是 查找 。 它 是 在 一 组 对 象 中 找到 目标 位 置 的 过 程 。 
列表 有 两 种 基本 查找 方法 : 顺序 查找 和 折 半 查找 。 顺 序 查找 可 以 在 任意 列表 中 定位 
数据 项 ; 而 折 半 查找 需要 列表 是 排序 的 。 

结构 化 编程 的 原则 要 求 算法 被 分 解 成 称 为 子 工法 的 小 单元 。 每 个 子 算法 依次 又 可 以 
分 成 更 小 的 子 算法 。 

通常 ， 有 两 种 方法 编写 求解 问题 的 算法 : 一 种 是 使 用 迭代 ; 另 一 种 是 使 用 递归 。 任 
何 时 候 只 要 算法 的 定义 不 涉及 算法 本 身 ， 它 就 是 迭代 的 。 任 何 时 候 只 要 算法 出 现在 
它 的 定义 中 ,算法 就 是 递归 定义 的 。 
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8.9 练习 
小 测验 


在 本 书 网 站 上 提供 一 套 与 本 章 相 关 的 交互 式 试 题 。 强 烈 建 议 学 生 在 做 本 章 练习 前 首先 完 
成 相关 测验 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 算法 的 正式 定义 是 什么 ? 

2. 给 出 用 于 结构 化 程序 设计 中 的 三 种 结构 的 定义 。 
3. UML 图 与 算法 有 何 关系 ? 

4. 伪 代 码 与 算法 有 何 关系 ? 

5. 排序 算法 的 用 途 是 什么 ? 

6. 本 章 有 哪 三 种 基本 排序 算法 ? 

7. 查找 算法 的 用 途 是 什么 ? 

8. 本 章 讨论 的 基本 查找 算法 主要 有 哪 两 种 ? 

9. 给 出 迭代 过 程 的 定义 和 一 个 例子 。 

10. 给 出 递归 过 程 的 定义 和 一 个 例子 。 


练习 题 


1. 使 用 求 和 算法 ， 画 一 张 表 ， 显 示 下 面 列 表 中 每 个 整数 被 处 理 后 的 和 值 。 
20 12 70 81 45 1 3 81 
2. 使 用 乘积 算法 ， 画 一 张 表 ， 显 示 下 面 列表 中 每 个 整数 被 处 理 后 的 乘积 值 。 
2 12 8 11 10 5 20 
3. 使 用 FindLargest 算法 ， 画 一 张 表 ， 显 示 下 面 列表 中 每 个 整数 被 处 理 后 的 Largest 的 值 。 
l18 12 8 20 10 32 5 
4. 使 用 FindSmallest 算法 ， 画 一 张 表 ， 显 示 下 面 列表 中 每 个 整数 被 处 理 后 的 Smallest 的 值 。 
“18 3 11 820 12 
5. 使 用 选择 排序 算法 ， 手 工 排序 下 列 数据 列表 并 借助 表 给 出 每 轮 所 做 的 工作 。 
14 7 23 31 40 56 78 9 2 
6. 使 用 冒 泡 排序 算法 ， 手 工 排序 下 列 数据 列表 并 借助 表 给 出 每 轮 所 做 的 工作 。 
14 7 23 31 40 56 78 9 2 
7. 使 用 插入 排序 算法 ,手工 排序 下 列 数据 列表 并 借助 表 给 出 每 轮 所 做 的 工作 。 
7 23 31 40 56 78 9 2 
8. 一 个 列表 包含 以 下 元 素 。 前 两 个 元 素 已 经 使 用 选择 排序 算法 排 好 序 了 ， 那 么 在 进行 了 选择 排序 的 三 
轮 后 列表 中 的 元 素 排序 结果 如 何 ? 
7 8 26 44 13 23 98 57 
9. 一 个 列表 包含 以 下 元 素 。 前 两 个 元 素 已 经 使 用 冒 泡 排 序 算法 排 好 序 了 ， 那 么 在 进行 了 冒 泡 排序 的 三 
轮 后 列表 中 的 元 素 排序 结果 如 何 ? 
7 8 26 44 13 23 57 98 
10. 一 个 列表 包含 以 下 元 素 。 前 两 个 元 素 已 经 使 用 插入 排序 算法 排 好 序 了 ， 那 么 在 进行 插入 排序 的 三 轮 
后 列表 中 的 元 素 排 序 结果 如 何 ? 
3 13 7 26 44 23 98 57 
11. 一 个 列表 包含 以 下 元 素 。 使 用 折 半 查找 算法 ， 跟 踪 查 找 88 的 步骤 ， 要 求 给 出 每 一 步 中 first、mid 
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和 last 的 值 。 
8 13 17 26 44 56 88 97 

12. 一 个 列表 包含 以 下 元 素 。 使 用 折 半 查找 算法 ， 跟 踪 查 找 20 的 步 又， 要 求 给 出 每 一 步 中 first、mid、 

last 的 值 。 

17 26 44 56 88 97 

13. 使 用 图 8-18 (顺序 查找 )， 显 示 查 找 目标 11 (不 在 列表 中 ) 的 所 有 步骤 。 
14. 使 用 图 8-19 ( 折 半 查找 )， 显 示 查 找 目标 17 (不 在 列表 中 ) 的 所 有 步骤 。 
15. 应 用 阶乘 算法 的 迭代 定义 ， 当 求 6! (6 的 阶乘 ) 的 值 时 ， 显 示 每 一 步 中 下 的 值 。 
16. 应 用 阶乘 算法 的 递归 定义 ， 当 求 6 ! 的 值 时 ， 显 示 每 一 步 中 下 的 值 。 
17. 用 伪 代 码 写 出 一 个 递归 算法 ， 使 用 图 8-24 中 


的 定义 ， 求 两 整数 的 最 大 公约 数 (gcd) 。 在 这 scd (x,y) -| y= | 
个 定义 中 ， 表 达 式 “x mod y” 意 思 是 x 除 以 ged ,x mody) 其 他 
y， 取 余数 作为 操作 的 值 。 图 8-24 练习 题 17 
18. 使 用 图 8-24 中 的 定义 ， 求 下 列 值 : 
a. gcd(7, 41) b. gcd(12, 100) c. gcd(80, 4) d. gcd(17, 29) 


19. 用 伪 代 码 写 一 递归 算法 ,使 用 图 8-25 中 的 
定义 , 求 一 次 从 nn 个 对 象 中 取 k 个 对 象 的 1 车 k= 0 或 n = 
组 合 Cln, DAD = 
举人 宫 。 Cn-1, A + C(n-1, k-1) 若 n>k>0 


20. 使 用 图 8-25 中 的 定义 , 求 下 列 值 : 
a. C(10, 3) b. C(5, 5) 
c. C(2, 7) d. C(4, 3) 
. 斐 波 那 契 序列 ( Fib(n)) 被 用 在 科学 和 数学 


图 8-25 练习 题 19 


2 


(eA 


若 n=0 
上 ， 如 图 8-26 所 示 。 用 伪 代 码 写 一 递归 算 Pbm=| | pe 
法 ， 求 Fibln) 的 值 。 Fib(n) = Fib(n—1) + Fib(n—2) 车 n>1 


22. 使 用 图 8-26 中 的 定义 ， 求 下 列 值 : 
a. Fib(2) b. Fib(3) 图 8-26 练习 题 21 
c. Fib(4) d. Fib(5) 

23. 画 出 使 用 两 个 循环 的 选择 排序 算法 的 UML 图 。 髓 套 循环 用 来 在 未 排序 的 子 列表 中 找 出 最 小 的 
元 素 。 

24. 画 出 使 用 两 个 循环 的 冒 泡 排序 算法 的 UML 图 。 藤 套 循 环 用 来 在 未 排序 的 子 列表 中 交换 相 邻 的 数 
据 项 。 

25. 画 出 使 用 两 个 循环 的 插入 排序 算法 的 UML 图 。 奶 套 循环 用 来 在 排序 的 子 列表 中 做 插 人 工作 。 

26. 画 出 使 用 子 算法 的 冒 泡 排 序 算法 的 UML 图 。 子 算法 对 未 排序 的 子 列表 进行 骨 泡 。 

27. 画 出 使 用 子 算法 的 插入 排序 算法 的 UML 图 。 子 算法 对 排序 的 子 表 做 插入 工作 。 

28. 用 伪 代 码 写 出 图 8-9 中 的 UML 图 的 算法 。 

29. 用 伪 代 码 写 出 图 8-10 中 的 UML 图 的 算法 。 

30. 用 伪 代 码 写 出 使 用 两 个 嵌 套 循环 的 选择 排序 算法 。 

31. 用 伪 代 码 写 出 使 用 子 算法 的 选择 排序 算法 ， 子 算法 是 在 未 排序 的 子 列表 中 求 最 小 的 整数 。 

32. 用 伪 代 码 写 出 使 用 两 个 髓 套 循环 的 冒 泡 排 序 算法 。 

33. 用 伪 代 码 写 出 使 用 子 算法 的 冒 泡 排序 算法 ， 子 算法 是 在 未 排序 的 子 列表 中 做 冒 泡 工 作 。 

34. 用 伪 代 码 写 出 使 用 两 个 艇 套 循环 的 插入 排序 算法 。 

35. 用 伪 代 码 写 出 使 用 子 算法 的 插 人 排序 算法 ， 子 算法 是 在 未 排序 的 子 列表 中 做 插 人 工作 。 

36. 用 伪 代码 写 出 顺序 查找 算法 ， 包 含 如 果 目 标 找 到 或 找 不 到 时 算法 的 终止 条 件 。 

37. 用 伪 代 码 写 出 折 半 查找 算法 ， 包含 如 果 目 标 找到 或 找 不 到 时 算法 的 终止 条 件 。 
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38. 使 用 乘积 算法 的 UML 图 ， 画 图 计算 x' 的 值 ，x 和 是 两 个 给 定 的 整数 。 
39. 用 伪 代 码 写 一 算法 , 求 x" 的 值 ，x 入 是 两 个 给 定 的 整数 。 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 小 程序 。 强 烈 建议 学 生 通 过 学 
试 这 些 应 用 程序 来 加 深 对 每 章 讨论 内 容 的 理解 。 
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第 8 章 讨论 了 算法 ， 显 示 了 如 何 用 UML 或 伪 代 码 编写 算法 解决 问题 。 本 章 将 学 习 能 实 
现 伪 代 码 的 编程 语言 ， 或 者 是 能 实现 解决 方案 的 UML 描述 的 编程 语言 。 本 章 并 不 是 要 教会 
一 种 特殊 的 编程 语言 ， 而 是 旨 在 比较 和 对 照 不 同 的 语言 。 
目标 
通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 
e 描述 从 机 器 语言 到 高 级 语言 的 编程 语言 演化 ; 
理解 如 何 使 用 解释 器 或 编译 器 将 高 级 语言 中 的 程序 翻译 成 机 器 语言 ; 
区 分 4 种 计算 机 语言 模式 ; 
理解 过 程式 模式 和 在 模式 中 程序 单元 与 数据 项 间 的 交互 ; 
理解 面向 对 象 模 式 和 在 这 种 模式 中 程序 单元 与 对 象 间 的 交互 ; 
定义 函数 式 模式 ， 理 解 它 的 应 用 ; 
定义 声明 式 模式 ， 理 解 它 的 应 用 ; 
定义 过 程式 和 面向 对 象 语言 中 的 常见 概念 。 


9.1 演化 


对 计算 机 而 言 ， 要 编写 程序 就 必须 使 用 计算 机 语言 。 计 算 机 语言 是 指 编写 程序 时 ， 根 据 
事先 定义 的 规则 (语法 ) 而 写 出 的 预定 语句 集合 。 计 算 机 语言 经 过 多 年 的 发 展 已 经 从 机 器 语 
言 演化 到 高 级 语言 。 


9.1.1 机 器 语言 
在 计算 机 发 展 的 早期 ， 唯 一 的 程序 设计 语言 是 机 器 语言 。 每 台 计 算 机 有 其 自己 的 机 器 语 
， 这 种 机 器 语言 由 “0” 和 “1” 序 列 组 成 。 在 第 5 章 中 ， 我 们 看 到 在 一 台 原 始 假想 的 计算 
机 中 ， 我 们 需要 用 11 行 代码 去 读 两 个 整数 、 把 它们 相 加 并 输出 结果 。 当 用 机 器 语言 来 写 时 ， 
这 些 代码 行 就 成 了 11 行 二 进 制 代码 ， 每 一 行 16 位 ， 如 表 9-1 所 示 。 
表 9-1 两 个 整数 相 加 的 机 器 语言 代码 


GPE O01 0010 0000 0001 
(240F)i6 0010 0100 0010 0010 
(1FEF)ie 0001 1111 0100 0010 
(241F)ie 0010 1111 1111 1111 
(1040)ie 0000 0000 0000 0000 


机 器 语言 是 计算 机 硬件 唯一 能 理解 的 语言 ， 它 由 具有 两 种 状态 的 电子 开关 构成 : 关 ( 表 
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示 0 ) 和 开 (表示 1 )。 

计算 机 唯一 识别 的 语言 是 机 器 语言 

虽然 用 机 器 语言 编写 的 程序 真实 地 表示 了 数据 是 如 何 被 计算 机 操纵 的 。 但 它 至 少 有 两 个 
缺点 : 首先 ， 它 依赖 于 计算 机 。 如 果 使 用 不 同 的 硬件 ， 那 么 一 台 计 算 机 的 机 器 语言 与 另 一 台 
计算 机 的 机 器 语言 就 不 同 。 其 次 ， 用 这 种 语言 编写 程序 是 非常 单调 乏味 的 ， 而 且 很 难 发 现 错 
误 。 现 在 我 们 将 机 器 语言 时 代称 为 编程 语言 的 第 一 代 。 


9.1.2 ”汇编 语言 


编程 语言 中 接 下 来 的 演化 是 伴随 着 用 带 符号 或 助 记 符 的 指令 和 地 址 代替 二 进 制 码 而 
发 生 的 。 因 为 它们 使 用 符号 ， 所 以 这 些 语言 首先 被 称 为 符号 语言 。 这 些 助 记 符 语 言 后 来 
就 被 称 为 汇编 语言 。 假 想 计算 机 用 于 替代 机 器 语言 的 汇编 语言 (如 表 9-2 所 示 ) 显示 在 程 
序 9-1 中 。 


表 9-2 两 整数 相 加 的 汇编 语言 代码 


汇编 语言 代码 说 明 
LOAD RF Keyboard 从 键盘 控制 器 中 取 数 ， 存 到 寄存 器 F 中 
STORE Numberl RF 把 寄存 器 F 中 的 内 容 存 到 Numberl 中 
LOAD RF Keyboard 从 键盘 控制 器 中 取 数 ， 存 到 寄存 器 F 中 
STORE Number2 RF 把 寄存 器 F 中 的 内 容 存 到 Number2 中 
LOAD RO Numberl 把 Numberl 中 的 内 容 存 人 寄存 器 0 中 
LOAD RI Number2 把 Number2 中 的 内 容 存 人 寄存 器 1 中 
ADDI R2 RO RI 把 寄存 器 0 和 寄存 器 1 相 加 ， 结 果 放 入 寄存 器 2 中 
STORE Result  R2 把 寄存 器 2 的 内 容 存 人 Result 中 
LOAD RF Result 把 Result 中 的 值 放 入 寄存 器 F 中 
STORE Monitor RF 把 寄存 器 F 中 的 值 存 人 显示 控制 器 中 
HALT 停止 


称 为 汇编 程序 的 特殊 程序 用 于 将 汇编 语言 代码 翻译 成 机 器 语言 。 
9.1.3 ”高 级 语言 


尽管 汇编 语言 大 大 提高 了 编程 效率 ， 但 仍然 需要 程序 员 在 所 使 用 的 硬件 上 花费 大 部 分 精 
力 。 用 符号 语言 编程 也 很 枯燥 ， 因 为 每 条 机 器 指令 都 必须 单独 编码 。 为 了 提高 程序 员 效 率 以 
及 从 关注 计算 机 转 到 关注 要 解决 的 问题 ， 促 进 了 高 级 语言 的 发 展 。 

高 级 语言 可 移植 到 许多 不 同 的 计算 机 ， 使 程序 员 能 够 将 精力 集中 在 应 用 程序 上 ， 而 不 
是 计算 机 结构 的 复杂 性 上 。 高 级 语言 旨 在 使 程序 员 摆 脱 汇编 语言 繁琐 的 细节 。 高 级 语言 同 汇 
编 语 言 有 一 个 共性 : 它们 必须 被 转化 为 机 器 语言 ， 这 个 转化 过 程 称 为 解释 或 编译 (本 章 后 面 
介绍 )。 

数 年 来 ， 人 们 开发 了 各 种 各 样 的 语言 ， 最 著名 的 有 BASIC、COBOL 、Pascal、Ada 、C、 
C++ 和 Java。 程 序 9.1 显示 了 两 整数 相 加 的 C++ 语言 代码 。 虽 然 程 序 看 起 来 有 点 长 ， 但 有 
些 代码 行 是 文档 (注释 )。 
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程序 9.1 ”C++ 中 的 加 法 程序 


/* This program reads two integers from keyboard and prints their sum. 
Written by: 
Date: 
*/ 
#include<iostream> 
using namespace std; 
int main() 
{ 
// Local Declarations 
int number 1; 
int number 2; 
int result; 
// Statements 
cin >> number 1; 
cin >> number 2; 
result = number 1 + number 2; 
cout << result; 
return 0; 
}// main 


9.2 翻译 


当今 程序 通常 是 用 一 种 高 级 语言 来 编写 。 为 了 在 计算 机 上 运行 程序 ,程序 需要 被 翻译 成 
它 要 运行 在 其 他 的 计算 机 的 机 器 语言 。 高 级 语言 程序 被 称 为 源 程 序 。 被 翻译 成 的 机 器 语言 
序 称 为 目标 程序 。 有 两 种 方法 用 于 翻译 : 编译 和 解释 。 


9.2.1 编译 
编译 程序 通常 把 整个 源 程 序 翻译 成 目标 程序 。 


9.2.2 解释 


有 些 计算 机 语言 使 用 解释 器 把 源 程序 翻译 成 目标 程序 。 解 释 是 指 把 源 程 序 中 的 每 一 行 翻 
译 成 目标 程序 中 相应 的 行 ， 并 执行 它 的 过 程 。 但 是 ， 我 们 需要 党 识 到 在 颂 释 中 的 两 利息 各 
在 Java 语言 之 前 被 有 些 程序 使 用 的 和 Java 使 用 的 解释 。 

1. 解释 的 第 一 种 方法 

在 Java 语言 之 前 的 有 些 解释 式 语言 (如 BASIC 和 APL) 使 用 一 种 称 为 解释 的 第 一 种 方 
法 的 解释 过 程 ， 因 为 缺少 其 他 任何 的 名 字 ， 所 以 称 为 解释 的 第 一 种 方法 。 在 这 种 解释 中 ， 源 
程序 的 每 一 行 被 翻译 成 被 其 使 用 的 计算 机 上 的 机 器 语言 ， 该 行 机 器 语言 被 立即 执行 。 如 果 在 
翻译 和 执行 中 有 任何 错误 ， 过 程 就 显示 消息 ， 其 余 的 过 程 就 被 中 止 。 程 序 需要 被 改正 ， 再 次 
从 头 解释 和 执行 。 第 一 种 方法 被 看 成 是 一 种 慢 的 过 程 ， 这 就 是 大 多 数 语 言 使 用 编译 而 不 是 解 
释 的 原因 。 

2. 解释 程序 的 第 二 种 方法 

随 着 Java 的 到 来 ， 一 种 新 的 解释 过 程 就 被 引入 了 。Java 语言 能 向 任何 计算 机 移植 。 为 
了 取得 可 移植 性 ， 源 程序 到 目标 程序 的 翻译 分 成 两 步 进行 : 编译 和 解释 。Java 源 程 序 首先 被 
编译 ， 创 建 Java 的 字 节 代码 ， 字 节 代 码 看 起 来 像 机 器 语言 中 的 代码 ， 但 不 是 任何 特定 计算 
机 的 目标 代码 ， 它 是 一 种 虚拟 机 的 目标 代码 ， 该 虚拟 机 称 为 Java 虚拟 机 或 JVM。 字 节 代 码 
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然后 能 被 任何 运行 JVM 模拟 器 的 计算 机 编译 或 解释 ， 也 就 是 运行 字 节 代码 的 计算 机 只 需要 
JVM 模拟 器 ， 而 不 是 Java 编译 器 。 


9.2.3 ”翻译 过 程 


编译 和 解释 的 不 同 在 于 ， 编 译 在 执行 前 翻译 整个 源 代码 ， 而 解释 一 次 只 翻译 和 执行 源 代 
码 中 的 一 行 。 但 是 ， 两 种 方法 都 遵循 图 9-1 中 显示 的 相同 的 翻译 过 程 。 









符号 助 记 符 指令 可 编码 指令 代码 
| 语法 
分 析 器 : 
目标 文件 
图 9-1 源 代码 翻译 过 程 
1. 词法 分 析 器 
词法 分 析 器 一 个 符号 接 一 个 符号 地 读 源 代码 ， 创 建 源 语言 中 的 助 记 符 表 。 例 如 ，5 个 符 
号 w、h、i、1、e 被 读 入 ， 组 合 起 来 就 形成 了 C、C++ 或 Java 语言 中 的 助 记 符 while。 
2. 语法 分 析 器 
词法 分 析 器 分 析 一 组 助 记 符 ， 找 出 指令 。 例 如 ,语法 分 析 器 使 用 助 记 符 “x”、“=”、“0” 


创建 C 语 言 中 的 赋值 语句 “x=0”。 在 第 18 章 中 讨论 语言 识别 时 ， 我 们 将 更 详细 地 讨论 词 
法 分 析 器 和 语法 分 析 器 的 功能 。 

3. 语义 分 析 器 

语义 分 析 器 检查 语法 分 析 器 创建 的 句子 ， 确 保 它 们 不 含有 二 义 性 。 计 算 机 语义 通常 是 无 
二 义 性 的 ， 这 意味 着 这 一 步骤 或 者 是 在 翻译 器 中 被 省 略 ， 或 者 是 其 责任 被 最 小 化 。 第 18 章 
也 详细 讨论 语义 分 析 。 

4. 代码 生成 器 

在 无 二 义 性 指令 被 语义 分 析 器 创建 之 后 ， 每 条 指令 将 转化 为 一 组 程序 将 要 在 其 上 运行 的 
计算 机 的 机 器 语言 。 这 个 是 由 代码 生成 器 完成 的 。 


9.3 ”编程 模式 


当今 计算 机 语言 按照 它们 使 用 的 解决 问题 的 方法 来 分 类 。 因 此 ， 模 式 是 计算 机 语言 看 待 
要 解决 问题 的 一 种 方式 。 计 算 机 语言 可 分 成 4 种 模式 ， 过程 性 (强制 性 )、 面 向 对 象 、 函 数 
式 和 声 说 式 。 图 9-2 总 结 了 这 些 范式 。 





计算 机 语言 模式 


DO FORTRAN 口 Smalltalk 口 LISP 口 Prolog 
DCOBL 口 C++ OD Scheme 

口 BASIC 口 Visual 

口 C 口 Basic 

口 Pascal 口 C# 

口 Ada 口 Java 


图 9-2 编程 语言 分 类 
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9.3.1 过 程式 模式 


在 过 程式 模式 (或 强制 性 模式 ) 中 ， 我们 把 程序 看 成 是 操纵 被 动 对 象 的 主动 主体 。 我 们 
在 日 常生 活 中 遇 到 许多 被 动 对 象 : 石头 、 书 、 灯 等 。 一 个 被 动 对 象 本 身 不 能 发 出 一 个 动作 ， 
但 它 能 从 主动 主体 接收 动作 。 

过 程式 模式 下 的 程序 就 是 主动 主体 ， 该 主体 使 用 称 为 数据 或 数据 项 的 被 动 对 象 。 作 为 
被 动 对 象 的 数据 项 存储 在 计算 机 的 内 存 中 ， 程 序 操纵 它们 。 为 了 操纵 数据 ， 主 动 主体 ( 程 
序 ) 发 出 动作 ， 称 之 为 过 程 。 例 如 ， 考 虑 一 个 打印 文件 内 容 的 程序 ， 为 了 能 被 打印 ， 文 件 需 
要 存储 在 内 存 中 (或 一 些 像 内 存 一 样 的 寄存 器 中 )。 文 件 是 一 个 被 动 对 象 或 一 个 被 动 对 象 集 
合 。 为 了 打印 文件 ， 程 序 使 用 了 一 个 称 为 print 的 过 程 。 过 程 print 通常 包括 了 需要 告诉 计算 
机 如 何 打印 文件 中 每 一 个 字符 的 所 有 动作 。 程 序 调 用 过 程 print。 在 过 程式 模式 中 ， 对 象 ( 文 
件 ) 和 过 程 (print) 是 完全 分 开 的 实体 。 对 象 (文件 ) 是 一 个 能 接收 print 动作 或 其 他 一 些 动 
作 (如 删除 、 复 制 等 ) 的 独立 实体 。 为 了 对 文件 应 用 这 些 动作 中 的 任何 一 个 ， 我 们 需要 一 个 
作用 于 文件 的 过 程 。 过 程 print (或 复制 或 删除 ) 是 编写 的 一 个 独立 实体 ， 程 序 只 是 触发 它 。 

为 了 避免 每 次 需要 打印 文件 时 都 编写 一 个 新 过 程 ， 我 们 可 以 编写 一 个 能 打印 任何 文件 的 
通用 过 程 。 当 写 这 个 过 程 时 ， 对 文件 名 的 每 个 引用 都 被 诸如 F、FILE 或 其 他 之 类 的 符号 蔡 
代 。 当 过 程 被 调用 (触发) 时 ， 我们 传递 实际 要 打印 的 文件 名 给 过 程 ， 这 样 可 以 编写 一 个 过 
程 print， 在 程序 中 调用 两 次 ， 打 印 不 同 的 文件 。 图 9-3 显示 了 程序 如 何 能 调用 不 同 的 预定 义 
过 程 ， 打 印 或 删除 不 同 的 目标 文件 。 









printFile 
过 程 


printFile(File1) : : 
ee : copyFile : 
种 ia 和 各 


printFile(File2) 


程序 


deleteFile : 


过 程 : : EE : 
: : FileN : 


预定 义 的 过 程 被 动 对 象 
图 9-3 ”过 程式 模式 的 概念 


我 们 需要 把 过 程 与 程序 触发 区 分 开 。 程 序 不 定义 过 程 (后 面 解释 )， 它 只 触发 或 调用 过 
程 。 过 程 必须 已 经 存在 。 

当 使 用 过 程式 高 级 语言 时 ， 程 序 仅 由 许多 过 程 调用 构成 ， 除 此 之 外 没有 任何 东西 。 这 
不 是 显而易见 的 ， 但 即使 使 用 像 加 法 运算 符 (+) 这 样 的 简单 数学 运算 符 时 ， 我 们 也 是 正在 
使 用 一 个 过 程 调用 一 个 已 经 编写 的 过 程 。 例 如 ， 当 使 用 表达 式 A+B 将 两 个 对 象 A 和 B 的 值 
相 加 时 ， 我们 就 是 在 调用 过 程 add， 传递 两 个 对 象 的 名 字 给 过 程 。 过 程 add 需要 两 个 作用 于 
的 对 象 。 它 把 两 个 对 象 的 值 相 加 ， 返 回 结果 。 换 言 之 ,表达 式 A+B 是 add ( A，B) 的 缩写 。 
语言 的 设计 者 编写 了 这 些 过 程 ， 我 们 才能 调用 它 。 

如 果 我 们 考虑 过 程 和 被 作用 于 的 对 象 ， 那 么 过 程式 模式 的 概念 就 变 得 更 为 简单 ， 且 容 
易 理 解 。 这 种 模式 的 程序 由 三 部 分 构成 : 对 象 创建 部 分 、 一 组 过 程 调用 和 每 个 过 程 的 一 
组 代码 。 有 些 过 程 在 语言 本 身 中 已 经 被 定义 。 通 过 组 合 这 些 代码 ， 开 发 者 可 以 建立 新 的 
过 程 。 
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图 9-4 显示 了 过 程式 程序 的 三 个 组 成 部 分 。 在 语言 中 也 有 额外 的 助 记 符 用 来 界定 或 组 织 
调用 。 但 这 个 图 中 并 没有 显示 出 来 。 一 一 

一 些 过 程式 语言 

在 过 去 的 几 十 年 中 , 一些 高 级 强制 性 (过 程式 ) 语言 发 展 
起 来 ， 如 FORTRAN 、COBOL 、Pascal、C 和 Ada。 

(1) FORTRAN 

FORTRAN (FORmula TRANslation)， 由 Jack Backus 领导 
下 的 一 批 IBM 工程 师 所 设计 ， 于 1957 年 变 成 商用 的 。FORT- 
RAN 是 第 一 代 高 级 语言 。 在 过 去 的 40 年 中 ，FORTRAN 经 历 了 
多 个 版 本 : FORTRAN、 FORTRAN I 、FORTRAN NV、FORTRAN a 
77、FORTRAN 99 和 HPF( 高 性 能 FORTRAN)。 最 新 版 本 (HPF) 过 程式 程序 
用 于 高 速 多 处 理 器 计算 机 系统 。FORTRAN 所 具备 的 一 些 特征 图 9-4 过 程式 程序 的 组 成 部 分 
使 得 40 年 后 它 仍然 是 科学 或 工程 应 用 中 的 理想 语言 。 这 些 特 征 概 括 如 下 : 

。 高 精度 算法 。 

e 处 理 复杂 数据 的 能 力 。 

e 指数 运算 (a)。 

(2) COBOL 

COBOL (COmmon Business-Oriented Language) 由 一 批 计算 机 专家 在 美国 海军 的 Grace 
Hopper 指导 下 设计 出 来 。COBOL 有 一 个 特定 的 设计 目标 : 作为 商业 编程 语言 使 用 。 商 业 环 
境 中 的 问题 完全 不 同 于 工程 环境 中 的 问题 。 商 业 中 程序 设计 的 要 求 概括 如 下 : 

e 快速 访问 文件 和 数据 库 。 

e 快速 更 新 文件 和 数据 库 。 

e 生成 大 量 的 报表 。 

e 界面 友好 的 格式 化 的 输出 。 

(3 ) Pascal 

Pascal 由 Niklaus Wirth 于 1971 年 在 瑞士 的 苏黎世 发 明 ， 根 据 17 世纪 发 明 Pascaline 计 
算 器 的 法 国 数学 家 、 哲 学 家 Blaise Pascal 来 命名 。Pascal 设计 时 有 一 个 特定 目标 : 通过 强调 
结构 化 编程 方法 来 教 初学 者 编程 。 尽 管 Pascal 成 为 学 术 中 最 流行 的 语言 ， 但 它 从 未 在 工业 中 
达到 同等 流行 的 程度 。 现 在 的 过 程 化 语言 归功 于 该 语言 。 

(4)C 

C 语言 是 由 贝尔 实验 室 的 Dennis Ritchie 在 20 世纪 70 年 代 初 期 发 明 的。 最 初 用 于 编写 
操作 系统 和 系统 软件 (UNIX 操作 系统 的 大 部 分 是 用 C 编写 )。 后 来 ， 由 于 以 下 原因 而 在 程 
序 员 中 流行 : 

e C 有 一 个 结构 化 的 高 级 编程 语言 应 有 的 所 有 高 级 指令 ， 使 程序 员 无 需 知道 硬件 细节 。 

e C 也 具有 一 些 低级 指令 ,使 得 程序 员 能 够 直接 、 快 速 地 访问 硬件 。 相 对 于 其 他 高 级 

语言 ，C 更 接近 于 汇编 语言 ， 这 使 得 它 对 系统 程序 设计 员 来 说 是 一 种 好 语言 。 

e C 是 非常 有 效 的 语言 ， 指 令 短 。 这 种 简洁 吸引 了 想 编 写 短 程序 的 程序 员 。 

(5) Ada 

Ada 是 根据 Lord Byron 的 女儿 Augusta Ada Byron 和 助手 Charles Babbage (分 析 引 擎 的 
发 明 者 ) 的 名 字 来 命名 的 。Ada 是 为 美国 防 部 (DoD ) 而 开发 的 ， 并 成 为 了 所 有 DoD 承包 人 


每 个 过 程 的 一 组 代码 
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使 用 的 统一 语言 。Ada 有 3 个 特征 使 其 成 为 DoD 和 工业 的 流行 语言 : 
e Ada 有 其 他 过 程式 语言 那样 的 高 级 指令 。 
e Ada 有 人 允许 实时 处 理 的 指令 ， 从 而 便于 过 程控 制 。 
e Ada 具有 并 行 处 理 能 力 ， 可 以 在 具有 多 处 理 器 的 主机 上 运行 。 


9.3.2 面向 对 象 模式 


面向 对 象 模式 处 理 活动 对 象 ， 而 不 是 被 动 对 象 。 我 们 在 日 常生 活 中 遇 到 许多 活动 对 象 : 
汽车 、 自 动 门 、 洗 盘 机 等 。 在 这 些 对 象 上 执行 的 动作 都 包含 在 这 些 对 象 中 : 对 象 只 需要 接收 
合适 的 外 部 刺激 来 执行 其 中 一 个 动作 。 

回 到 我 们 在 过 程式 模式 中 的 例子 ， 在 面向 对 象 模式 中 的 文件 能 把 所 有 的 被 文件 执行 的 过 
程 〈 在 面向 对 象 模式 中 称 为 方法 ) 打包 在 一 起 ， 这 些 过 程 有 打印 、 复 制 、 删 除 等 。 在 这 种 模 
式 中 的 程序 仅仅 向 对 象 发 送 相应 请 求 (打印 、 复 制 、 删 除 等 )， 文 件 就 会 被 打印 、 复 制 或 删 


除 。 图 9-5 说 明了 这 样 的 概念 。 






打印 方法 






File1.print 
File2.delete oo 
删除 方法 


图 9-5 面向 对 象 模式 的 概念 


这 些 方法 被 相同 类 型 的 所 有 对 象 共 享 。 也 被 从 这 些 对 象 继 承 的 其 他 对 象 共享 ， 如 后 面 
将 讨论 的 。 如 果 程 序 要 打印 文件 File1， 它 只 需要 发 送 活动 对 象 所 需 的 刺激 ， 文 件 Filel 就 被 
打印 。 

比较 过 程式 模式 和 面向 对 象 模 式 (图 9-3 和 图 9-5 )， 我 们 看 出 过 程式 模式 中 的 过 程 是 独 
立 的 实体 ， 但 面向 对 象 模式 中 的 方法 是 属于 对 象 领地 的 。 

类 

如 图 9-5 所 示 ， 相 同类 型 的 对 象 (如 文件 ) 需要 一 组 方法 ， 这 些 方法 显示 了 这 类 对 象 对 
来 自 对 象 “ 领 地 ”外 的 刺激 的 反应 。 为 了 创建 这 些 方法 ， 面 向 对 象 语言 ， 如 C++、Java 和 
C# ( 读 作 “C sharp”) 使 用 称 为 类 的 单元 ， 如 图 9-6 所 示 。 程 序 单 
元 的 准确 格式 因 不 同 的 面向 对 象 语 言 而 不 同 (参见 附录 了 )。 

1. 方法 

总 体 上 ， 方 法 的 格式 与 有 些 过 程式 语言 中 用 的 函数 非常 相似 。 
每 个 方法 有 它 的 头 、 局 部 变量 和 语句 。 这 就 意味 着 我 们 对 过 程式 语 
言 所 讨论 的 大 多 数 特性 都 可 以 应 用 在 为 面向 对 象 程 序 所 写 的 方法 
上 。 换 言 之 ， 我 们 可 以 认为 面向 对 象 语 言 实际 上 是 带 有 新 的 理念 和 
新 的 特性 的 过 程式 语言 的 扩展 。 例 如 ，C++ 语言 就 是 一 个 面向 对 象 
的 C 语言 的 扩展 。C++ 语言 甚至 可 以 作为 不 需要 或 极 少 使 用 对 象 的 
过 程式 语言 使 用 。Java 语言 是 C++ 的 扩展 ， 但 它 是 一 个 完全 的 面 
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向 对 象 的 语言 。 

2. 继承 性 

在 面向 对 象 模式 中 ， 作 为 本 质 ， 一 个 对 象 能 从 另 一 个 对 象 继承 。 这 个 概念 被 称 为 继承 
性 。 当 一 般 类 被 定义 后 ， 我 们 可 以 定义 继承 了 一 般 类 中 一 些 特 性 的 更 具体 的 类 ， 同 时 这 些 类 
有 具有 一 些 新 特性 。 例 如 ， 当 一 个 几何 形状 类 被 定义 后 ,我们 就 可 以 定义 称 为 矩形 的 类 。 和 矩形 
是 具有 额外 特性 的 几何 形状 。 

3. 多 态 性 

多 态 性 意思 是 “许多 形状 ”。 在 面向 对 象 模式 中 的 多 态 性 是 指 我 们 可 以 定义 一 些 具 有 相 
同名 字 的 操作 ， 而 这 些 操作 在 相关 类 中 做 不 同 的 事情 。 例 如 ， 我 们 定义 了 两 个 类 : 矩形 和 
圆 ， 都 是 从 几何 形状 类 继承 下 来 的 。 我 们 定义 名 字 都 为 area 的 两 个 操作 ， 一 个 在 和 矩形 类 中 ; 
一 个 在 圆 类 中 。 它 计算 矩形 或 圆 的 面积 。 两 个 操作 有 相同 的 名 字 ， 但 做 不 同 的 事情 ， 因 为 计 
算 和 矩形 的 面积 和 计算 圆 的 面积 需要 不 同 的 操作 数 和 操作 。 

4. 一 些 面向 对 象 语言 

人 们 已 经 发 明了 一 些 面 向 对 象 语言 。 我 们 简要 讨论 其 中 两 种 语言 的 特性 : C++ 和 Java。 

(1) C++ 

C++ 语言 是 由 贝尔 实验 室 Bjarne Stroustrup 等 人 开发 出 来 的 ， 是 比 C 语 言 更 高 级 的 一 
种 计算 机 编程 语言 。 它 使 用 类 来 定义 相似 对 象 的 通用 属性 以 及 可 以 应 用 于 它们 本 身 的 各 种 
操作 。 例 如 ， 程 序 员 可 以 定义 一 个 几何 体 类 ( Geometrical Shapes) 和 所 有 二 维 图 形 所 共用 的 
属性 ， 如 中 心 、 边 数 等 。 这 个 类 也 可 以 定义 出 可 以 应 用 于 几何 体 本 身 的 操作 (函数 或 方法 )， 
例如 ,计算 并 打印 出 面积 、 周 长 、 中 心 点 的 坐标 等 。 一 个 程序 可 以 创建 不 同 几 何 体 类 的 对 
象 ， 每 个 对 象 有 不 同 的 中 心 点 和 边 数 。 程 序 可 以 为 每 个 对 象 计算 并 打印 出 面积 、 周 长 和 中 心 
坐标 等 。 

C++ 语言 的 设计 遵循 三 条 基本 原则 特性 : 封装 、 继 承 和 多 态 。 

(2 ) Java 

Java 是 由 Sun Microsystems 公司 开发 的 ， 它 在 C 和 C++ 的 基础 上 发 展 而 来 ， 但 是 C++ 
的 一 些 特性 (如 多 重 继承 等 ) 从 语言 中 被 移 除 ， 从 而 使 Java 更 健壮 。 另 外 ， 该 语言 是 完全 面 
向 类 操作 的 。 在 C++ 中 ， 你 甚至 可 以 不 用 定义 类 就 能 解决 问题 。 而 在 Java 中 ， 每 个 数据 项 
都 属于 一 个 类 。 

Java 中 的 程序 可 以 是 一 个 应 用 程序 也 可 以 是 一 个 小 程序 。 应 用 程序 是 指 一 个 可 以 完全 独 
立 运行 的 程序 。 小 程序 则 是 其 入 在 超 文本 标记 语言 (参见 第 6 章 ) 中 的 程序 ， 存储 在 服务 器 
上 并 由 浏览 器 运行 。 浏 览 器 也 可 以 把 它 从 服务 器 端 下 载 到 本 地 运行 。 

在 Java 中 ， 应 用 程序 (或 小 程序 ) 是 类 以 及 类 实例 的 集合 。Java 自 带 的 丰富 类 库 是 它 的 
有 趣 特征 之 一 。 尽 管 C++ 也 提供 类 库 ， 但 在 Java 中 用 户 可 以 在 提供 的 类 库 基 础 上 构建 新 类 。 

在 Java 中 ， 程 序 的 执行 也 是 独 具 特 色 的 。 构 建 一 个 类 并 把 它 传 给 编译 器 。 由 编译 器 
来 调用 类 的 方法 。Java 的 另 一 大 有 趣 的 特点 是 多 线程 。 线 程 是 指 按 顺 序 执行 的 动作 序列 。 
C++ 只 允许 单线 程 执行 (整个 程序 作为 单线 程 )， 但 是 Java 允许 多 线程 执行 ( 几 行 代码 同时 
执行 )。 


9.3.3 ”函数 式 模式 
在 函数 式 模式 中 程序 被 看 成 是 一 个 数学 函数 。 关 于 这 点 ， 函 数 是 把 一 组 输入 映射 到 一 组 
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输出 的 黑 盒 子 (图 9-7 )。 

例如 ， 求 和 可 以 被 认为 是 具有 壮 个 输入 和 1 个 输出 的 函数 。 该 函数 实现 nn 输入 值 相 加 得 
到 总 和 并 最 终 输 出 求 和 结果 。 函 数 式 语言 主要 实现 
下 面 的 功能 : 输入 

1 ) 函数 式 语言 预定 义 一 系列 可 供 任何 程序 员 
调用 的 原始 (原子) 函数 。 

2 ) 函数 式 语言 允许 程序 员 通 过 若干 原始 函数 
的 组 合 创 建新 的 函数 。 

例如 ， 定 义 一 个 称 为 first 的 原始 函数 ， 由 它 来 完成 从 一 个 数据 列表 中 抽取 第 一 个 元 素 
的 功能 。 再 定义 另 一 个 函数 rest， 由 它 完 成 从 一 个 数据 列表 中 抽取 出 除 第 一 个 元 素 以 外 的 所 
有 元 素 。 通 过 两 个 函数 的 组 合 使 用 ， 可 以 在 一 个 程序 中 定义 一 个 函数 来 完成 对 第 三 个 元 素 的 
抽取 ， 如 图 9-8 所 示 。 


输出 





图 9-7 ”函数 式 语言 中 的 函数 





(11, 8, 9, 10, 6) (8, 9, 10, 6) 









(7, 11, 8, 9, 10, 6) 


图 9-8 ”提取 列表 中 的 第 三 个 元 素 


函数 式 语言 相对 过 程式 语言 具有 两 方面 优势 : 它 支 持 模块 化 编程 并 且 人 允许 程序 员 使 用 
已 经 存在 的 函数 来 开发 新 的 函数 。 这 两 个 因素 使 得 程序 员 能 够 编写 出 庞大 而 且 不 易 出 错 的 
程序 。 

一 些 困 数 式 语言 

我 们 以 LIST 和 Scheme 为 例 来 简要 介绍 函数 式 语 言 。 

(1) LIST 

表 处 理解 释 语言 (LISt Programming，LISP) 是 20 世纪 60 年 代 早期 由 麻 省 理工 学 院 科 
研 小 组 设计 开发 的 。 它 是 一 种 把 表 作 为 处 理 对 象 的 语言 。 

(2 ) Scheme 

表 处 理解 释 语言 没有 统一 标准 化 。 不 久之 后 ， 就 有 许多 不 同 的 版 本 流传 于 世 。 实 际 使 用 
的 标准 是 由 麻 省 理工 学 院 在 20 世纪 70 年 代 早期 开发 的 ， 称 为 Scheme。 

Scheme 语言 定义 了 一 系列 原始 函数 来 解决 问题 。 函 数 名 和 函数 的 输入 列表 写 在 括号 内 ， 
结果 是 一 个 可 用 于 其 他 函数 输入 的 列表 。 例 如 ， 有 一 个 函数 car， 用 来 从 列表 中 取出 第 一 个 
元 素 。 第 二 个 函数 cdr 用 来 从 列表 中 取出 除 第 一 个 元 素 以 外 的 所 有 元 素 。 两 个 函数 如 下 : 


(Ea 学 名 8 二 了 和 的 一 汪 
(Ed 2 3 7 8 1 17 20)=—™ 3 7 和 11 17 20 


现在 可 以 通过 组 合 这 两 个 函数 来 完成 从 列表 中 取出 第 三 个 元 素 的 函数 。 

(eaz ' (Ciedr Cedr lst )y) 

如 果 将 上 面 的 函数 应 用 于 列表 2 3 7 8 11 17 20, 结果 是 取出 7。 我 们 来 分 析 一 下 ， 
最 里 面 的 括号 取出 列表 3 7 8 11 17 20。 中 间 一 层 括号 取出 列表 7 8 11 17 20。 再 通过 函 
数 car 取出 该 列表 的 第 一 个 元 素 7。 
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9.3.4 ”说明 式 模式 


说 明 式 模式 依据 逻辑 推理 的 原则 响应 查询 。 它 是 在 由 希腊 数学 家 定义 的 规范 的 逻辑 基础 
上 发 展 而 来 的 ， 并 且 后 来 发 展 成 为 一 阶 谓词 演算 (first-order predicate calculus ) 。 

逻辑 推理 以 推导 为 基础 。 逻 辑 学 家 根据 已 知 正确 的 一 些 论断 (事实 )， 运 用 逻辑 推理 的 
可 靠 的 准则 推导 出 新 的 论断 (事实 )。 例 如 ， 逻 辑 学 中 著名 的 推导 原则 如 下 : 


If (AisB) and (BisC )， then (AiscC) 
将 此 原则 应 用 于 下 面 的 事实 : 


事实 1: Socrates is a human 一 Ris B 


事实 2: A human is mortal + BB Ls 
我 们 可 以 推导 出 下 面 的 事实 : 
事实 3: Socrates is mortal —* A Ts 人 RC 


程序 员 需 要 学 习 有 关 主 题 领域 的 知识 (知道 该 领域 内 的 所 有 已 知 的 事实 ) 或 是 向 该 领域 
的 专家 获取 事实 。 程 序 员 还 应 该 精通 如 何 逻辑 上 严谨 地 定义 准则 。 这 样 程 序 才 能 推导 并 产生 
新 的 事实 。 

说 明 性 语言 也 有 自身 的 缺憾 ， 那 就 是 有 关 特 殊 领 域 的 程序 由 于 要 收集 大 量 的 事实 信息 
而 变 得 非常 庞大 。 这 也 是 说 明 性 程序 迄今 为 止 只 局 限于 人 工 智能 等 领域 的 原因 。 我 们 将 在 第 
18 章 进 一 步 讨 论 逻 辑 。 

Prolog 

最 著名 的 说 明 性 语言 是 Prolog (PROgramming in LOGic)， 它 是 由 法 国人 A.Colmerauer 

于 1972 年 设计 开发 的 。Prolog 中 的 程序 全 部 由 事实 和 规则 组 成 。 例 如 ， 关 于 人 类 最 初 
事实 可 陈述 如 下 : 


human (John) 
mortal (human) 


用 户 可 以 进行 询问 : 
? -mortal (John) 


程序 会 啊 应 yes。 


9.4 共同 概念 

在 这 一 节 ， 我 们 通过 对 一 些 过 程式 语言 的 快速 浏览 ， 发 现 共 同 的 概念 。 这 些 概念 中 的 一 
些 对 大 多 数 面向 对 象 语言 也 适用 ， 这 是 因为 当 创建 方法 时 面向 对 象 模式 使 用 过 程式 模式 。 
9.4.1 标识 各 


所 有 计算 机 语言 的 共同 特点 之 一 就 是 都 具有 标识 符 ， 即 对 象 的 名 称 。 标 识 符 允 许 给 程序 
中 对 象 命 名 。 例 如 ， 计 算 机 中 每 一 个 数据 都 存储 在 一 个 唯一 的 地 址 中 。 如 果 没 有 标识 符 来 符 
号 化 代表 数据 的 位 置 ， 你 就 不 得 不 去 了 解 并 直接 使 用 数据 的 地 址 来 操纵 它们 。 取 而 代 之 ， 只 
要 简单 给 出 数据 的 名 字 就 可 以 让 编译 器 去 跟踪 数据 实际 存放 的 物理 地 址 。 


9.4.2 ”数据 类 型 
数据 类 型 定义 了 一 系列 值 及 应 用 于 这 些 值 的 一 系列 操作 。 每 种 数据 类 型 值 的 集合 称 为 数 
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据 类 型 的 域 。 大 多 数 语言 都 定义 了 两 类 数据 类 型 : 简单 数据 类 型 和 复合 数据 类 型 。 

1. 简单 数据 类 型 

简单 数据 类 型 (有 时 称 为 原子 类 型 、 基 本 类 型 、 标 量 类 型 或 内 建 类 型 ) 是 不 能 分 解 成 更 
小 数据 类 型 的 数据 类 型 。 强 制 性 语言 已 经 定义 一 些 简单 数据 类 型 : 

e@ 整数 类 型 是 不 包括 小 数 部 分 的 完整 的 数 。 整 数 的 取 值 范围 依赖 于 语言 。 有 些 语言 支 

持 多 种 整数 大 小 。 

e@ 实数 类 型 是 带 小 数 部 分 的 数字 。 

e 字符 类 型 是 被 语言 使 用 的 潜在 字符 集中 的 符号 ， 例 如 ，ASCII 或 Unicode。 

e 布尔 类 型 是 只 取 两 个 值 ( 真 或 假 ) 的 数据 类 型 。 

2. 复合 数据 类 型 

复合 数据 类 型 是 一 组 元 素 ， 其 中 每 个 元 素 都 是 简单 数据 类 型 或 复合 数据 类 型 (这 是 递归 
定义 )。 大 多 数 语言 定义 了 如 下 的 复合 数据 类 型 : 

e 数组 是 一 组 元 素 ， 其 中 每 个 元 素 具 有 相同 类 型 。 

e 记录 是 一 组 元 素 ， 其 中 的 元 素 可 以 具有 不 同 的 类 型 。 

3. 变量 

变量 是 存储 单元 的 名 字 。 如 第 5 章 讨论 过 的 ， 每 个 内 存单 元 在 计算 机 中 都 有 一 个 地 址 。 
虽然 计算 机 内 部 使 用 地 址 ， 但 对 程序 员 而 言 却 十 分 不 方便 ， 首 先 ， 程序 员 不 知道 内 存 中 数据 
项 的 相对 地 址 。 其 次 ， 数 据 项 在 内 存 中 可 能 占据 多 个 地 址 。 名 字 ( 作 为 地 址 的 替代 ) 使 程序 
员 解 放出 来 ， 只 需 在 程序 如 何 执行 的 层次 上 考虑 。 程 序 员 可 以 使 用 一 个 变量 ，( 如 score) 来 
保存 测试 中 得 到 的 整 型 数值 。 既 然 变 量 含有 一 个 数据 项 ， 那 它 就 有 类 型 。 

(1 ) 变量 声明 

大 多 数 过 程式 语言 和 面向 对 象 语言 要 求 变量 在 使 用 前 被 声明 。 声 明 警 告 计算 机 被 赋予 名 
字 和 类 型 的 变量 将 在 程序 中 使 用 。 计 算 机 预 留 出 要 求 的 存储 区 域 ， 并 命名 它 。 我 们 在 前 一 节 
讨论 过 ， 声 明 是 对 象 创建 的 一 部 分 。 例 如 ， 在 C、C++ 和 Java 中 ， 我们 可 以 定义 三 种 变量 
数据 类 型 一 一 字符 、 整 数 和 实数 ， 它 们 显示 如 下 : 


char CcC; 
int num; 
double result; 


第 一 行 声明 了 一 个 具有 字符 类 型 的 变量 C; 第 二 行 声 明 整 数 类 型 变量 num ; 第 三 行 声明 
实数 类 型 变量 result。 

(2 ) 变量 初始 化 

虽然 存储 在 变量 中 的 数据 值 在 程序 执行 过 程 中 可 能 改变 ,但 大 多 数 过 程式 语言 允许 变量 
在 它 声明 时 进行 初始 化 。 初 始 化 就 是 在 变量 中 存储 一 个 值 。 下 面 显 示 了 变量 如 何 同时 被 声明 
和 初始 化 。 

char C='2'，; 


int num=123; 
double result=256,782; 


4. 字面 值 
字面 值 是 程序 中 使 用 的 预定 义 的 值 。 例 如 ， 当 半径 存储 在 变量 > 中 ， 需 要 计算 圆 的 面积 
时 ， 可 以 使 用 表达 式 3.14 xr*， 其 中 "(pi) 的 近似 值 就 是 被 用 作 字面 值 。 在 大 多 数 程序 设计 


程 良 褒 矿 请 言 


五 二 
TP 有 百 
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中 ， 可 以 有 整数 、 实 数 、 字 符 和 布尔 字面 值 ， 还 可 以 有 字符 串 字 面值 。 为 了 把 字符 和 
字符 串 字 面值 从 变量 名 和 其 他 对 象 中 区 分 开 ， 大 多 数 语言 要 求 字 符 字面 值 被 括 在 单 引号 中 ， 
如 'A'， 而 字符 串 字面 值 被 括 中 双 引 号 中 ， 如 "Anne"。 
S. 常量 
面值 。 


cost t+- Price X 1.08 


字面 值 被 看 作 一 种 不 好 的 编程 实践 ， 除 非 我 们 能 确信 字面 值 的 值 将 不 会 随时 间 而 改变 
(如 几何 中 的 值 )。 但 是 ， 大 多 数字 面值 都 会 随时 间 而 改变 它 的 值 。 例 如 ， 销 售 税 今年 是 


个 程序 ， 可 以 只 改变 程序 开始 处 的 一 行 


开始 处 被 定义 ， 而 在 程序 中 被 使 用 。 


8%， 明 年 可 能 就 不 相同 。 当 我 们 写 程 序 计算 事物 的 费用 时 ， 我 们 就 不 应 该 在 程序 中 使 用 字 
由 于 这 个 原因 ， 大 多 数 编程 语言 定义 常量 。 常 量 ( 像 变 量 一 样 ) 是 一 个 可 以 存储 值 的 命 
名 的 位 置 。 但 值 在 程序 开始 处 被 定义 后 就 不 能 改变 。 但 是 ， 如 果 下 一 年 我 们 需要 再 次 使 用 这 


const float taxMultiplier = 1.08; 


常量 的 值 。 例 如 ， 在 C 或 C++ 程序 中 ， 税 率 能 在 

cost = price * taxMultiplier; 

6. 输入 和 输出 

件 进行 操作 时 。 大 多 数 程序 设计 语 
(1) 输入 


< 


注意 常量 ( 像 变 量 一 样 ) 有 类 型 。 当 常量 被 声明 时 ， 要 定义 它 的 类 型 。 


scanf (wead™ 


几乎 所 有 的 程序 都 需要 输入 和 (或 ) 输出 数据 。 这 些 操作 将 比较 复杂 ， 尤 其 是 对 大 的 文 


使 用 一 些 预先 定义 好 的 函数 完成 输入 和 输出 。 
gnum) 7 


数据 或 者 通过 语句 或 者 通过 预先 定义 的 函数 来 完成 输入 。C 语言 有 几 个 输入 函数 。 例 如 ， 
中 。%d 告诉 用 户 程 序 需要 一 个 整 型 数值 。 
(2 ) 输出 


scanf 函数 用 来 从 键盘 读 取 数 据 并 格式 化 ， 把 它 存 储 在 一 个 变量 中 。 下 面 是 一 个 例子 : 


当 程 序 遇 到 该 函数 指令 时 ， 程 序 等 待 用 户 输入 一 个 整数 。 然 后 将 这 个 值 存 储 在 变量 num 


部 分 。 下 面 的 语句 表示 在 文本 字符 串 的 末尾 显示 一 个 变量 的 值 。 
Printf("The value of the number is 

7. 表达 式 

的 表达 式 : 


printf 函数 能 够 在 显示 器 上 输出 一 个 字符 串 。 程 序 员 可 以 将 一 个 或 几 个 变量 变 为 字符 串 的 一 
: $d" num) 
2 类 5 十 '3 


数据 或 者 通过 语句 或 者 通过 预先 定义 的 函数 来 完成 输出 。C 语言 有 几 个 输出 函数 。 例 如 ， 


表达 式 是 由 一 系列 操作 数 和 运算 符 简 化 后 的 一 个 单一 数值 。 例 如 ， 下 面 是 一 个 值 为 13 
(1 ) 运算 符 


它们 在 语法 或 规则 等 方面 的 使 用 是 严格 定义 的 。 


运算 符 是 用 来 完成 一 个 动作 的 特定 语言 的 语法 记号 。 最 为 熟悉 的 一 些 运算 符 都 是 从 数学 
中 得 到 的 。 例 如 , 乘法 (*) 是 一 个 运算 符 ， 表 示 两 个 数 相 乘 。 每 一 种 语言 都 有 运算 符 ， 并 且 
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e 算术 运算 符 被 用 在 大 多 数 语言 中 。 表 9-3 显示 了 一 些 用 于 C、C++ 和 Java 中 的 算术 


运算 符 。 
表 9-3 算术 运算 符 
come 


e 关系 运算 符 用 于 比较 两 个 数据 的 大 小 关系 。 关 系 运算 符 的 结果 是 逻辑 值 (true 或 
false)。C、C++ 和 Java 语言 使 用 6 种 关系 运算 符 ， 如 表 9-4 所 示 。 


表 9-4 关系 运算 符 


!= 不 等 于 Numl!=Num2 
e 逻辑 运算 符 是 逻辑 值 (true 或 false) 组 合 后 得 到 的 一 个 新 值 。C 语言 使 用 如 表 9-5 所 
示 的 3 种 逻辑 运算 符 。 
表 9-5 ”逻辑 运算 符 


装 
bg 








4 
TT™ 


! (Num1<Num?2 ) 
(Num1<5 ) && (Num2>10 ) 
(Num1<5 ) || (Num2>10 ) 





(2 ) 操作 数 
操作 数 接收 一 个 运算 符 的 动作 。 对 于 任何 一 个 运算 符 可 能 有 1、2 或 更 多 个 操作 数 。 举 
个 算术 的 例子 ， 除 法 运算 的 操作 数 是 被 除数 和 除数 。 


9.4.3 语句 


每 条 语句 都 使 程序 执行 一 个 相应 动作 。 它 被 直接 翻译 成 一 条 或 多 条 计算 机 可 执行 的 
指令 。 例 如 ，C、C++ 和 Java 定义 了 许多 类 型 的 语句 。 在 本 节 中 我 们 将 对 其 中 一 些 加 以 
讨论 。 
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(1 ) 赋值 语句 

赋值 语句 给 变量 赋值 。 换 言 之 ， 它 存储 一 个 值 在 变量 中 ， 该 变量 是 在 声明 部 分 已 经 被 创 
建 的 。 在 我 们 的 算法 中 ， 使 用 符号 “二 ”定义 赋值 。 大 多 数 语 言 ( 像 C、C++ 和 Java) 使 用 
“=” 来 赋值 。 其 他 语言 ( 像 Ada 或 Pascal) 使 用 “:=” 来 赋值 。 

(2 ) 复合 语句 

复合 语句 是 一 个 包含 0 个 或 多 个 语句 的 代码 单元 。 它 也 被 称 为 块 。 复 合 语句 使 得 一 组 语 
句 成 为 一 个 整体 。 复 合 语句 一 般 包 括 一 个 左 大 括号 、 一 个 可 选 语句 段 以 及 一 个 右 大 括号 。 下 
面 是 一 个 复合 语句 的 例子 。 

{ 


工学 
2033 


Li 


y 
} 
(3 ) 控制 语句 
控制 语句 是 语句 的 集合 ， 它 在 过 程式 语言 中 作为 一 个 程序 执行 。 语 句 通 常 是 一 句 接 一 句 
被 执行 的 。 但 是 ， 有 了 时 需要 改变 这 种 顺序 的 执行 。 例 如 ， 去 重复 一 句 或 一 组 语句 ， 两 组 语句 
的 执行 依赖 于 布尔 值 。 在 计算 机 机 器 语言 中 ， 为 这 种 背离 顺序 执行 所 提供 的 指令 称 为 jump 
指令 ， 这 在 第 5 章 简要 讨论 过 。 早 期 的 强制 性 语言 使 用 go to 语句 来 模拟 jump 指令 。 虽 然 
如 今 go to 还 能 在 一 些 强制 性 语言 中 看 到 ， 但 结构 化 编程 原则 不 倡导 使 用 它 。 相 反 ， 结 构 化 
编程 强烈 推荐 使 用 三 种 结构 : 顺序 、 选 择 和 重复 ， 正 如 我 们 在 第 8 章 中 讨论 的 。 强 制 性 语言 
中 的 控制 语句 与 选择 和 重复 有 关 。 
e 大 多 数 强制 性 语言 都 有 两 路 和 多 路 选择 语句 。 两 路 选择 通过 if-else 语句 取得 ; 多 路 
选择 通过 switch (或 case) 语句 取得 。 图 9-9 显示 了 if-else 语句 的 UML 图 和 代码 。 
在 if-else 语句 中 ， 如 果 条 件 为 真 ， 语 句 1 被 执行 ， 而 如 果 条 件 为 假 ， 语 句 2 被 执行 。 
语句 1 和 语句 2 都 可 以 是 任何 类 型 的 语句 ， 包 括 空 语句 或 复合 语句 。 图 9-9 还 显示 
了 switch (或 case) 语句 的 代码 。C 的 值 决 定 了 语句 1、 语 句 2 或 语句 3 中 哪 一 个 被 
执行 。 ( 


switch (c) 


{ 
case a: 语句 1; break; 
case b: 语句 2; break; 


case c: 语句 3; break; 
} 





图 9-9 两 路 和 多 路 判断 
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e 我 们 在 第 8 章 讨 论 过 重复 结构 。 大 多 数 强 制 性 语言 都 定义 了 1 ~ 3 个 能 实现 重复 的 
循环 语句 。C、C++ 和 Java 定义 了 3 个 循环 语句 ， 但 它们 都 可 以 使 用 while 循环 来 模 





拟 (图 9-10 )。 
[true] 
GD 
while for (int i=0; i<n; i++) 
(条 件 ) i 
a 语句 人 
代码 


图 9-10 3 a 


C 语言 中 主要 的 重复 语句 是 while 循环 。while 循环 是 一 个 预先 检查 的 循环 ， 它 检查 测 

试 表达 式 的 值 。 如 果 值 为 真 ， 则 进入 循环 迭代 一 次 ， 然 后 再 检测 。while 循环 被 认为 是 事件 
控制 循环 。 循 环 将 一 直 持续 到 一 个 事件 发 生 ， 即 将 被 测 表 达 式 的 值 从 真 变 为 假 。 

循环 同样 也 是 一 个 先 测试 循环 。 但 是 与 while 循环 不 同 的 是 ， 它 是 一 个 计数 器 控制 

， 计 数 器 被 初始 化 为 一 个 初 值 ， 然 后 在 每 一 次 迭代 中 增加 (或 减少 )。 当 计数 器 的 值 达 

be 

do 循环 也 是 一 个 事件 控制 循环 ,但 是 与 while 循环 不 同 的 是 ， 它 是 一 个 后 测试 循环 。 循 
环 进 行 一 次 迭代 后 ， 测 试 表达 式 的 值 。 如 果 是 假 ， 则 终止 。 如 果 是 真 ， 就 再 进行 一 次 循环 而 
后 再 测试 。 

子 程序 

第 8 章 介绍 过 选择 排序 算法 可 以 写成 一 个 主 程序 和 一 个 子 程序 。 所 有 需要 在 未 排序 列 
表 中 找 出 最 小 数据 项 的 过 程 都 可 以 聚合 成 一 个 子 程序 。 子 程序 的 概念 在 过 程式 语言 中 极其 
重要 ， 在 面向 对 象 语 言 中 的 作用 要 少 些 。 前 面 解释 过 用 过 程式 语言 写 的 程序 通常 是 预先 定 
义 的 一 组 过 程 ， 如 加 法 、 乘 法 等 。 但 是 ， 有 时 ， 那 些 完 成 单一 任务 的 这 些 过 程 的 子 集 能 集 
合 在 一 起 ， 放 在 它们 自己 的 程序 单元 中 ， 也 就 是 子 程序 。 因 为 子 程序 使 程序 变 得 更 结构 
化 ， 所 以 这 是 非常 有 用 的 。 完 成 特定 任务 的 子 程序 能 一 次 编 
写 ， 多 次 调用 。 就 像 在 编程 语言 中 的 预定 义 过 程 一 样 。 

子 程序 也 能 使 程序 更 容易 。 在 增 量 程序 开发 中 ， 程 序 员 可 
以 通过 在 每 一 步 增加 一 个 子 程序 一 步 步 测 试 程序 。 在 编写 下 一 
个 子 程序 前 进行 测试 ， 这 能 帮助 检查 错误 。 图 9-11 说 明了 子 程 主 程序 
序 的 概念 。 图 9-11 子 程序 概念 
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(1 ) 局 部 变量 

在 过 程式 语言 中 ， 就 像 主 程序 一 样 ， 子 程序 能 调用 预定 义 的 过 程 ， 在 局 部 对 象 上 操作 。 
” 当 子 程序 每 次 被 调用 时 ， 这 些 局 部 对 象 或 局 部 变量 被 创建 ， 当 控制 从 子 程序 返回 时 被 销毁 。 

局 部 对 象 属于 子 程序 。 

(2 ) 参数 

子 程序 仅仅 作用 于 局 部 变量 是 非常 少见 的 。 大 多 数 时 候 主 程序 需要 子 程序 作用 于 由 主 程 
序 创建 的 一 个 对 象 或 一 组 对 象 。 在 这 种 情况 下 ， 程 序 和 子 程序 使 用 参数 。 在 主 程序 中 称 为 实 
际 参 数 ， 在 子 程序 中 称 为 形式 参数 。 程 序 可 以 通过 下 列 两 种 方法 之 一 来 给 子 程序 传递 参数 .; 

@ 传 值 

@ 传 引用 

下 面 解 释 它 们 。 

(3 ) 传 值 

在 传 值 参数 中 ， 主 程序 和 子 程序 创建 两 个 不 同 的 对 象 (变量 )。 在 程序 中 创建 的 对 象 属 
于 程序 ; 在 子 程序 中 创建 的 对 象 属于 子 程序 。 因 为 作用 域 不 同 ， 所 以 相应 的 对 象 可 以 有 相同 
的 名 字 或 不 同 的 名 字 。 主 程序 和 子 程序 的 通信 是 单方 向 的 ， 从 主 程序 到 子 程序 。 主 程序 传递 
实际 参数 的 值 ， 存 储 到 子 程序 中 相应 的 形式 参数 中 。 从 子 程序 到 主 程序 没有 参数 的 通信 。 

例 9.1 假定 子 程序 是 为 主 程序 完成 打印 的 。 当 每 次 主 程序 需要 打印 值 时 ， 它 把 值 传递 
给 子 程序 并 打印 出 来 。 主 程序 有 它 自己 的 变量 X， 子 程序 也 有 它 自己 的 变量 A。 从 主 程序 
传递 给 子 程序 的 是 变量 X 的 值 。 这 个 值 被 存储 在 子 程序 的 变量 A 中 ， 子 程序 随后 要 打印 它 
(图 9-12 )。 


5 的 副本 被 传递 






print(A) X: 实际 参数 
{ i A: 形式 参数 
print the value of A 


} 


主 程序 


图 9-12 传 值 的 例子 


例 9.2 在 例 9.1 中 ,既然 主 程序 是 发 送 一 个 值 到 子 程序 ， 那么 为 了 这 个 目的 就 不 需 
要 一 个 变量 : 主 程序 可 以 仪 发 送 一 个 字面 值 给 子 程序 。 换 言 之 ， 主 程序 可 以 用 print(X) 或 
print(5) 调用 子 程序 。 

例 9.3 传 值 在 现实 生活 中 的 一 个 类 推 是 : 当 一 位 朋友 需要 借 或 读 一 本 你 写 的 有 价值 的 
书 。 因 为 书 是 珍贵 的 ， 或 可 能 已 售 完 ， 你 把 书 复印 了 一 份 ， 送 给 了 你 的 朋友 。 任 何 对 副本 的 
损坏 都 不 会 影响 你 的 书 。 

传 值 有 个 优点 : 子 程序 接收 的 仅仅 是 个 值 。 它 不 能 改变 (有 意 的 或 无 意 的 ) 主 程序 中 变 
量 的 值 。 但 是 ， 当 程序 实际 上 要 求 子 程序 这 样 做 时 ， 子 程序 不 能 改变 主 程序 中 变量 的 值 就 变 
成 了 缺点 。 

例 9.4 假定 主 程序 有 两 个 变量 X 和 站 ， 需 要 交换 它们 的 值 。 主 程序 调用 子 程序 swap 
来 完成 。 它 传递 X 和 YY 的 值 给 子 程序 ， 它 们 被 存储 在 两 个 变量 A 和 B 中 。swap 子 程序 使 用 


182 锚 9 苹 


局 部 变量 T (临时 )， 交 换 A 和 了 B 中 的 两 个 值 。 但 X 和 YY 中 的 原始 值 保 留 原样 : 它们 并 没有 
交换 。 在 图 9-13 中 说 明 这 些 。 


7 的 副本 被 传递 


5 的 副本 被 传递 





X 和 Y: 实际 参数 
A 和 B: 形式 参数 
T: 局 部 (临时 ) 参数 


图 9-13 传 值 并 不 起 作用 的 例子 


(4) 传 引用 

传 引用 被 设计 来 允许 子 程序 改变 主 程序 中 变量 的 值 。 在 传 引用 中 ,变量 (实际 上 它 是 内 
存 的 地 址 ) 被 主 程序 和 子 程序 共享 。 相 同 的 变量 可 能 在 主 程序 和 子 程序 中 有 不 同 的 名 字 ，, 但 
两 个 名 字 是 指向 同一 个 变量 。 我 们 可 以 形象 地 把 传 引用 看 成 是 有 两 个 门 的 盒子 ， 一 个 开 在 主 
程序 ; 另 一 个 开 在 子 程序 。 主 程序 可 以 把 值 留 在 盒子 里 给 子 程序 ， 子 程序 可 以 改变 这 个 原始 
的 值 ， 并 留 个 新 值 给 主 程序 。 


例 9.5 ”如果 使 用 同样 的 swap 子 程序 ， 但 让 变量 使 用 传 引用 ，X 和 YY 中 的 两 个 值 实际 
上 被 交换 ， 如 图 9-14 所 示 。 


swap (Ref X, Ref Y) 





X 和 Y: 实际 参数 
A 和 B; 形式 参数 
T; 局 部 (临时 ) 参数 


图 9-14 传 引用 的 例子 
(5 ) 返回 值 


子 程序 可 以 被 设计 成 返回 一 个 值 或 几 个 值 。 这 是 预定 义 过 程 被 设计 的 方法 。 当 使 用 表 
达 式 C -A+B 时， 实际 上 调用 过 程 add(A, B)， 该 过 程 返回 一 个 值 ， 并 存储 在 变量 C 中 。 
(6 ) 实现 


子 程序 概念 在 不 同 的 语言 中 被 不 同 地 实现 。 在 C 和 C++ 中 ， 子 程序 被 实现 为 函数 。 
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9.5 ” 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 


小 结 


Cooke, D. A. Concise Introduction to Computer Languages, Pacfic Grove, CA: Brooks/ 
Cole, 2003 

Tucker, A. and Noonan, R. Programming Language: Principles and Paradigms, Burr 
Ridge, IL: McGraw-Hill, 2002 

Pratt, T. and Zelkowitz, M. Programming Languages, Design and Implementation, 
Englewood Cliffs, NJ: Prentice Hall, 2001 

Sebesta, R. Concepts of Programming Languages, Boston, MA: Addison Wesley, 2006 


计算 机 语言 是 一 组 预定 义 的 单词 ， 按 照 预 定义 的 规则 (语言 的 语法 )， 这 些 单词 被 组 
合 进 一 个 程序 中 。 经 过 多 年 的 发 展 ， 计 算 机 语言 已 经 从 机 器 语言 演化 到 高 级 语言 。 
计算 机 能 理解 的 唯一 语言 是 机 器 语言 。 

高 级 语言 对 许多 不 同 的 计算 机 是 轻便 的 ， 它 允许 程序 员 专 注 于 应 用 ， 而 不 是 计算 机 
组 织 的 复杂 性 。 

为 了 在 计算 机 上 人 允许 一 个 程序 ， 程 序 需要 被 翻译 成 计算 机 本 地 的 机 器 语言 。 高 级 语 
言 程 序 称 为 源 程 序 。 翻 译 过 来 的 机 器 语言 程序 称 为 目标 程序 。 两 种 方法 被 用 来 翻译 : 
编译 和 解释 。 编 译 器 把 整个 源 程序 翻译 成 目标 程序 ， 解 释 是 指 一 行 接 一 行 地 把 源 程 
序 的 每 一 行 翻译 成 相应 目标 程序 行 ， 并 执行 它们 的 过 程 。 

翻译 过 程 使 用 词法 分 析 器 、 语 法 分 析 器 、 语 义 分 析 器 和 代码 生成 器 来 产生 助 记 
符 表 。 

模式 描述 了 计算 机 语言 被 用 来 处 理 要 解决 问题 的 方法 。 我 们 把 计算 机 语言 分 成 4 种 
模式 : 过 程式 、 面 向 对 象 、 函 数 式 和 说 明 式 。 过 程式 模式 把 程序 看 作 操 作 被 动 对 象 
的 活动 对 象 。FORTRAN 、COBOL 、Pascal、C 和 Ada 都 是 过 程式 语言 的 例子 。 面 向 
对 象 模式 处 理 活动 对 象 ， 而 不 是 被 动 对 象 。C++ 和 Java 是 常见 的 面向 对 象 语言 。 在 
函数 式 模式 中 ， 程 序 被 看 作 数 学 函数 。 在 上 下 文中 ， 函 数 是 把 一 组 输入 映射 到 一 组 
输出 的 黑 盒子 。LISP 和 Scheme 是 常见 的 函数 式 语言 。 说 明 式 模式 使 用 逻辑 推理 原 
则 来 回答 问题 。 一 个 最 有 名 的 说 明 式 语言 是 PROLOG。 

在 过 程式 和 面向 对 象 语言 中 的 一 些 常 见 概念 有 : 标识 符 、 数 据 类 型 、 变 量 、 字 面值 、 
常量 、 输 入 和 输出 、 表 达 式 和 语句 。 大 多 数 语言 使 用 两 类 控制 语句 : 判断 和 重复 。 
子 程序 是 过 程式 语言 间 的 共同 概念 。 


9.6 练习 


小 测验 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 继续 本 章 习题 前 首先 
完成 相关 测验 以 检测 对 本 材料 的 理解 。 
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复习 题 


1. 汇编 语言 与 机 器 语言 有 哪些 区 别 ? 

2. 汇编 语言 与 高 级 语言 有 哪些 区 别 ? 

3. 哪 种 计算 机 语言 与 计算 机 直接 相关 ， 并 被 计算 机 理解 ? 

4. 区 分 编译 和 解释 。 

5. 列 出 编程 语言 翻译 中 的 4 个 步骤 。 

6. 列 出 4 种 常见 的 计算 机 语言 模式 。 

7. 比较 和 对 照 过 程式 模式 与 面向 对 象 模式 。 

8. 定义 面向 对 象 语言 中 的 类 和 方法 ， 这 两 个 概念 间 的 联系 是 什么 ? 它们 与 对 象 概念 间 的 联系 又 是 什么 ? 
9. 定义 函数 式 模式 。 

10. 定义 说 明 式 模式 。 


练习 题 


1. 声 明 C 语言 中 的 三 个 整 型 变量 。 

2. 声 明 C 语言 中 的 三 个 实数 变量 ， 用 三 个 值 初始 化 它们 。 
3. 声 明 C 语言 中 分 别 为 字符 型 、 整 型 和 实数 的 三 个 常量 。 
4. 解释 为 什么 常量 必须 在 声明 时 进行 初始 化 。 

5. 找 出 下 列 C 语言 代码 段 中 statement 被 执行 的 次 数 。 


A=5 
while (A<8) 
{ 
statement; 
A=A+ 2; 
} 


6. 找 出 下 列 C 语言 代码 段 中 statement 被 执行 的 次 数 。 


A=5 

while (A<8) 

{ 
statement; 
A=A-2; 

} 


7. 找 出 下 列 C 语言 代码 段 中 statement 被 执行 的 次 数 。 


for (int i=5; i<20; i++) 
{ 

statement; 

i=i+1;} 


} 
8. 找 出 下 列 C 语言 代码 段 中 statement 被 执行 的 次 数 。 


A=5 
do 
{ 
statement; 
A=A+1; 
} while (A<10) 


9. 用 do-while 循环 写 出 练习 6 中 的 代码 。 


奸 序 诈 计 语 言 


10. 用 do-while 循环 写 出 练习 7 中 的 代码 。 
11. 用 while 循环 写 出 练习 7 中 的 代码 。 
12. 用 for 循环 写 出 练习 8 中 的 代码 。 
13. 用 for 循环 写 出 练习 6 中 的 代码 。 
14. 用 while 循环 写 出 一 个 从 不 执行 它 的 循环 体 的 代码 段 。 
15. 用 do 循环 写 出 一 个 从 不 执行 它 的 循环 体 的 代码 段 。 
16. 用 for 循环 写 出 一 个 从 不 执行 它 的 循环 体 的 代码 段 。 
17. 用 while 循环 写 出 一 个 永 不 停止 的 代码 段 。 
18. 用 do 循环 写 出 一 个 永 不 停止 的 代码 段 。 
19. 用 for 循环 写 出 一 个 永 不 停止 的 代码 段 。 
20. 在 下 列 代码 中 ， 找 到 所 有 的 字面 值 : 
C=12*A+4* (B-5) 
21. 在 下 列 代码 中 ， 找 到 变量 和 字面 值 : 


Hello="Hello"; 
22. 用 switch 语句 改写 下 列 代码 段 : 


if (A==4) statementl1; 
else 
if (A==6) statement2; 
else if(A==8) statement3; 


23. 如 果子 程序 calculate(A, B, S, P) 接收 A 和 B 的 值 ， 计 算 它 们 的 和 S 与 乘积 P， 哪 个 变量 要 用 传 


值 ? 哪个 变量 需要 用 传 引 用 ? 


24. 如 果子 程序 smaller(A, B, S) 接收 A 和 B 的 值 ， 找 出 两 个 中 较 小 的 ， 哪 个 变量 要 用 传 值 ? 哪个 变量 


需要 用 传 引用 ? 
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25. 如 果子 程序 cube(A) 接收 A 的 值 ， 计 算 它 的 立方 (A’ ), 给 A 传递 参数 时 是 用 传 值 还 是 用 传 引用 ? 


26. 如 果子 程序 需要 从 键盘 上 接收 A 的 值 ， 并 把 它 返 回 给 主 程序 ， 给 A 传递 参数 时 是 用 传 值 还 是 用 传 


引用 ? 


27. 如 果子 程序 需要 在 监视 器 上 显示 A 的 值 ， 给 A 传递 参数 时 是 用 传 值 还 是 用 传 引用 ? 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通 过 


尝试 这 些 应 用 程序 来 加 深 对 每 章 讨论 材料 的 理解 。 
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Foundations of Computer Science, Third Edition 


软件 工程 





这 一 章 介绍 软件 工程 的 概念 。 我 们 以 软件 生命 周期 为 起 点 ， 接 着 说 明 用 于 开发 过 程 的 两 
个 模型 : 瀑布 模型 和 增 量 模型 。 然 后 简要 讨论 开发 过 程 的 4 个 阶段 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

。 理解 软件 工程 中 的 软件 生命 周期 的 概念 ; 
描述 两 种 主要 的 开发 过 程 模型 : 瀑布 模型 和 增 量 模型 ; 
理解 分 析 阶 段 ， 描 述 在 分 析 阶 段 两 种 独立 的 方法 : 面向 过 程 分 析 和 面向 对 象 分 析 ; 
理解 设计 阶段 ， 描 述 在 设计 阶段 两 种 独立 的 方法 : 面向 过 程 设 计 和 面向 对 象 设计 ; 
描述 实现 阶段 ， 识 别 该 阶段 中 的 质量 问题 ; 
描述 测试 阶段 ， 区 分 白 盒 测试 和 黑 盒 测试 ; 
识别 软件 工程 中 文档 的 重要 性 ， 区 分 用 户 文档 、 系 统 文档 和 技术 文档 。 

软件 工程 是 建立 在 这 样 的 基础 之 上 ， 即 利用 合理 的 工程 方法 和 原则 来 获得 在 真实 机 器 上 
工作 的 可 靠 软件 。 这 个 定义 出 自 于 1969 年 第 一 届 国 际 软件 工程 会 议 ， 恰 巧 是 第 一 台 计 算 机 
诞生 30 年 之 际 。 


10.1 软件 生命 周期 


软件 生命 周期 是 软件 工程 中 的 一 个 基础 概念 。 软 件 和 其 他 的 产品 一 样 ， 周 期 性 地 重复 着 
一 些 阶段 (图 10-1 )。 

软件 最 初 由 开发 者 小 组 开发 。 通 常 ， 在 
它 需 要 修改 之 前 会 使 用 一 段 时 间 。 由 于 软件 
中 会 发 现 错误 、 设 计 改变 规则 或 公司 本 身 发 
生变 化 ， 这 些 都 导致 需要 经 常 修改 软件 。 为 
长 久 使 用 考虑 软件 应 该 被 修改 。 使 用 和 修 
改 ， 这 两 个 步骤 一 直 进 行 下 去 直到 软件 过 
时 。“ 过 时 ”意味 着 因 效 率 低下 、 语 言 过 时 、 
用 户 需 求 的 重大 变化 或 其 他 因素 而 导致 软件 
失去 它 的 有 效 性 。 


开发 过 程 模型 


虽然 软件 工程 涉及 图 10-1 中 的 所 有 三 个 过 程 ， 但 本 章 我 们 只 讨论 开发 过 程 ， 它 在 图 10-1 
中 处 于 循环 流程 之 外 。 在 软件 生命 周期 中 ， 开 发 过 程 包括 4 个 阶段 : 分 析 、 设 计 、 实 现 和 测 
试 。 开 发 过 程 有 多 种 模型 ， 这 里 我 们 讨论 最 常见 的 两 种 : 瀑布 模型 和 增 量 模 型 。 

1. 瀑布 模型 

软件 开发 过 程 的 一 种 非常 流行 的 模型 就 是 众所周知 的 瀑布 模型 (图 10-2 )。 在 这 种 模型 
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中 ， 开 发 过 程 只 有 一 个 方向 的 流动 。 这 意味 着 前 一 个 阶段 不 结束 ， 后 一 个 阶段 不 能 开始 。 

例如 ， 整 个 工程 的 分 析 阶 段 应 该 在 设计 
阶段 开始 前 完成 。 整 个 设计 阶段 应 该 在 实现 
阶段 开始 前 完成 。 

瀑布 模型 既 有 优点 ， 也 有 缺点。 优点 之 
一 就 是 在 下 一 个 阶段 开始 前 每 个 阶段 已 经 完 
成 。 例 如 ， 在 设计 阶段 的 小 组 能 准确 地 知道 
他 们 要 做 什么 ， 因 为 他 们 有 分 析 阶 段 的 完整 
结果 。 测 试 阶 段 能 测试 整个 系统 ， 因 为 整个 
系统 已 经 完成 。 但 是 ， 瀑 布 模型 的 缺点 是 难以 定位 问题 : 如 果 过 程 的 一 部 分 有 问题 ， 必 须 检 
查 整 个 过 程 。 

2. 增 量 模型 

在 增 量 模型 中 ， 软 件 的 开发 要 经 历 一 系列 步 又。 开发 者 首先 完成 整个 系统 的 一 个 简化 版 
本 ， 这 个 版 本 表示 了 整个 系统 ， 但 不 包括 具体 的 细节 。 图 10-3 显示 了 增 量 模型 的 概念 。 





图 10-2 瀑布 模型 





图 10-3 增 量 模型 


在 第 二 个 版 本 中 ， 更 多 的 细节 被 加 入 ， 而 有 些 还 没完 成 ， 然 后 再 次 测试 系统 。 如 果 这 时 
有 问题 ， 开 发 者 知道 问题 出 于 新 功能 。 直 到 现 有 系统 工作 正确 后 ， 他 们 才 增 加 新 的 功能 。 这 
样 过 程 一 直 继 续 下 去 ， 直 到 要 求 的 功能 全 部 被 加 入 。 


10.2 分 析 阶 段 


整个 开发 过 程 始 于 分 析 阶 段 ， 这 个 阶段 生成 规格 说 明文 档 ， 这 个 文档 说 明了 软件 要 做 什 
么 ， 而 没有 说 明 如 何 去 做 。 分 析 阶 段 可 以 使 用 两 种 独立 的 方法 ， 它 们 依赖 于 实现 阶段 使 用 的 
是 过 程 编程 语言 ， 还 是 面向 对 象 语言 。 本 节 简 单 地 讨论 这 两 种 方法 。 


10.2.1 面向 过 程 分 析 


如 果实 现 阶段 使 用 过 程式 语言 ， 那 么 面向 过 程 分 析 (也 称 为 结构 化 分 析 或 经 典 分 析 ) 就 
是 分 析 阶 段 使 用 的 方法 。 这 种 情况 下 的 规格 说 明 可 以 使 用 多 种 建 模 工具 ， 但 我 们 只 讨论 其 中 
少数 几 个 。 
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1. 数据 流 图 
数据 流 图 显示 了 系统 中 数据 的 流动 。 它 们 使 用 4 种 符号 : 方形 盒 表 示 数 据 源 或 数据 目 
的 ， 带 圆 角 的 矩形 表示 过 程 (数据 上 的 动作 )。 末 端 开 口 的 矩形 表示 数据 存储 的 地 方 ， 箭 头 
表示 数据 流 。 
图 10-4 显示 了 一 个 小 旅馆 中 预订 系统 的 简单 版 本 ， 它 接收 潜在 客户 通过 因特网 的 预订 ， 
根据 房间 是 否 空闲 确认 或 拒绝 预订 。 
图 例 
国 国 源 或 目的 。 ND 过 得 
[一 数据 存储 。 ”一 -、 数 据 流 


请 求 






处 理 预订 






可 用 房间 


被 预订 记录 
图 10-4 数据 流 图 的 一 个 例子 


这 个 图 中 的 过 程 之 一 (处 理 预订 ) 就 是 使 用 预订 文件 ， 接 受 或 拒绝 预订 。 如 果 预 订 被 接 
受 ， 它 将 被 记录 在 预订 文件 中 。 

2. 实体 关系 图 

分 析 阶 段 使 用 的 另 一 个 建 模 工具 是 实体 关系 图 。 因 为 这 个 图 也 用 于 数据 库 的 设计 ， 所 以 
我 们 将 在 12 章 中 讨论 它 。 

3. 状态 图 

状态 图 (参见 附录 B) 提供 了 另外 一 种 有 用 的 工具 ， 它 通常 用 于 当 系 统 中 的 实体 状态 
在 响应 事件 时 将 会 改变 的 情况 下 。 作 为 状态 图 的 一 个 例子 ， 我 们 显示 了 单 人 电梯 的 操作 。 
当 楼 层 按钮 被 按 ， 电 梯 将 按 要 求 的 方向 移动 ， 在 到 达 目 的 地 之 前 ， 它 不 会 响应 其 他 任何 
请 求 。 

图 10-5 显示 了 该 老式 电梯 的 状态 图 。 电 梯 可 以 是 三 种 状态 的 一 种 : 上升、 下降 或 停止 。 
每 种 状态 在 状态 图 中 用 圆 角 矩形 表示 。 当 电梯 处 在 停止 状态 时 ， 它 接收 请 求 。 如 果 请 求 的 楼 
层 与 当前 的 楼 层 相同 ， 那 请 求 被 忽略 ， 电 梯 保 持 停 止 状态 ; 如 果 请 求 的 楼 层 高 于 当前 楼 层 ， 
电梯 开始 上 行 ; 如 果 请 求 的 楼 层 低 于 当前 楼 层 ， 电 梯 开 始 下 行 。 一 旦 开始 移动 ， 电 梯 将 一 直 
保持 在 一 种 移动 状态 中 ， 直 至 到 达 请 求 的 楼 层 。 






RF: 请 求 楼 层 
CF: 当前 楼 层 


[RF>CF] 






[RF<CF] 






到 达 楼 层 到 达 楼 层 
[RF=CF] 请 求 
停止 


开 关 
图 10-5 ”状态 图 的 一 个 例子 
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10.2.2 面向 对 象 分 析 


如 果实 现 使 用 面向 对 象 语言 ， 那 么 面向 对 象 分 析 就 是 分 析 过 程 使 用 的 。 这 种 情况 下 的 规 
格 说 明文 档 可 以 使 用 多 种 工具 ， 但 我 们 只 讨论 其 中 少数 几 种 。 

1. 用 例 图 

用 例 图 给 出 了 系统 的 用 户 视图 : 它 显示 了 用 户 与 系统 间 的 交互 。 用 例 图 使 用 4 种 组 件 : 
系统 、 用 例 、 动 作者 和 关系 。 系 统 ( 用 和 矩形 表示 ) 执行 功能 。 系 统 中 的 行动 由 用 例 显示 ， 它 
用 圆 角 的 矩形 表示 。 动 作者 是 使 用 系统 的 某 人 或 某 事 。 虽 然 动 作者 用 线条 人 物 来 表示 ， 但 它 





们 并 不 需要 表示 人 类 。 

图 10-6 显示 老式 电梯 的 用 例 图 ， 在 图 10-5 中 已 经 显示 了 它 
的 状态 图 。 这 个 图 中 的 系统 是 电梯 。 唯 一 的 动作 者 是 电梯 的 使 用 按 电梯 按钮 
者 。 这 里 有 两 个 用 例 : 按 电梯 按钮 (在 每 层 的 大 厅 ) 和 在 电梯 内 
按 楼 层 按钮 。 电 梯 在 每 层 只 有 一 个 按钮 ， 它 给 电梯 移 到 该 层 的 按 楼 层 按钮 
类 图 图 10-6 用 例 图 的 一 个 例子 


分 析 的 下 一 步 就 是 创建 系统 的 类 图 。 例 如 ， 我 们 可 以 为 老式 电梯 创建 类 图 。 为 了 做 这 
些 ， 我 们 需要 考虑 系统 涉及 的 实体 。 在 电梯 系统 
中 ， 有 两 个 实体 类 : 按钮 和 电梯 本 身 。 但 是 ， 有 
两 种 不 同类 型 的 按钮 : 在 走廊 里 的 电梯 按钮 和 在 
电梯 里 的 楼 层 按钮 。 那 么 这 似乎 是 我 们 有 一 个 按 
钮 的 类 和 从 该 按钮 类 继承 的 两 个 类 : 电梯 按钮 类 罚 吉 1 楼 层 按钮 
和 楼 层 按钮 类 。 图 10-7 显示 了 我 们 为 电梯 问题 创 
建 的 第 一 个 类 图 。 

注意 : 电梯 按钮 类 和 楼 层 按钮 类 是 按钮 类 的 
子 类 。 但 是 ， 电 梯 类 与 两 个 按钮 类 (电梯 按钮 和 图 10-7 类 图 的 一 个 例子 
楼 层 按 钮 ) 间 的 关系 是 一 对 多 关系 (参见 附录 B)。 
电梯 系统 的 类 图 当然 是 可 以 扩展 的 ， 但 我 们 把 这 个 留 给 软件 工程 方面 的 书 。 

3. 状态 图 

类 图 完成 之 后 ， 就 可 以 为 类 图 中 的 每 个 类 准备 状态 图 。 面 向 对 象 分 析 中 的 状态 图 与 面向 
过 程 分 析 中 的 状态 图 起 相同 作用 。 这 意味 着 对 于 图 10-7 中 的 类 图 ， 我 们 需要 一 个 有 4 个 状 
态 的 图 。 


10.3 设计 阶段 

设计 阶段 定义 系统 如 何 完成 在 分 析 阶 段 所 定义 的 需求 。 在 设计 阶段 ， 系 统 所 有 的 组 成 部 
分 都 被 定义 。 
10.3.1 面向 过 程 设 计 

在 面向 过 程 设计 中 ， 我 们 既 要 设计 过 程 ， 也 要 设计 数据 。 我 们 讨论 一 类 注重 过 程 的 设计 
方法 。 在 面向 过 程 设计 中 ， 整 个 系统 被 分 解 成 一 组 过 程 或 模块 。 


1. 结构 图 
在 面向 过 程 设计 中 ， 说 明 模 块 间 关 系 的 常用 工具 是 结构 图 。 例 如 ， 图 10-5 显示 的 状态 
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图 的 电梯 系统 可 以 设计 成 一 组 模块 ， 这 些 模块 显示 在 图 10-8 中 的 结构 图 中 。 结 构图 将 在 附 
录 D 中 讨论 。 

2. 模块 化 电梯 

模块 化 意味 着 将 大 项 目 分 解 成 较 小 的 部 分 ， 以 


便 能 够 容易 理解 和 处 理 。 换 言 之 ， 模 块 化 意味 着 将 大 
下 移 
图 





程序 分 解 成 能 互相 通信 的 小 程序 。 前 一 节 讨 论 的 结构 


图 显示 了 电梯 系统 中 的 模块 化 。 当 系统 被 分 解 成 模块 


(1 ) 耦合 

耦合 是 对 两 个 模块 互相 绑 定 紧密 程度 的 度量 。 越 
紧 耦 合 的 模块 ， 它 们 的 独立 性 越 差 。 既 然 目 标 是 为 了 让 模块 尽 可 能 地 独立 ， 你 需要 让 它们 松 
散 耦 合 。 至 少 有 三 条 理由 说 明 松 散 耦 合 是 希望 的 : 

e 松散 耦合 的 模块 更 可 能 被 重用 ; 

e 松散 耦合 的 模块 不 容易 在 相关 模块 中 产生 错误 ; 

e 当 系 统 需要 修改 时 ， 松 散 耦 合 的 模块 允许 我 们 只 修改 需要 改变 的 模块 ， 而 不 会 影响 

到 不 需要 改变 的 模块 。 

软件 系统 中 模块 间 的 耦合 必须 最 小 化 。 

(2 ) 内 聚 

模块 化 的 另 一 个 问题 是 内 聚 。 内 聚 是 程序 中 处 理 过 程 相 关 紧 密 程度 的 度量 。 我 们 需要 尽 
可 能 最 大 化 软件 系统 模块 间 的 内 聚 。 

软件 系统 模块 间 的 内 聚 必须 最 天 化 。 


10.3.2 面向 对 象 设计 


在 面向 对 象 设计 中 ， 设 计 阶 段 通过 详细 描述 类 的 细节 来 继续 。 就 像 第 9 章 提 到 的 ， 类 是 
由 一 组 变量 (属性 ) 和 一 组 方法 组 成 。 面 向 对 象 设计 阶段 列 出 这 些 属性 和 方法 的 细节 。 图 10-9 
显示 了 在 老式 电梯 设计 中 使 用 的 4 个 类 的 细节 。 





图 10-8 结构 





图 10-9 带 有 属性 和 方法 类 的 一 个 例子 


10.4 实现 阶段 


在 瀑布 模型 中 ， 设 计 阶 段 完 成 之 后 ， 实 现 阶段 就 可 以 开始 了 。 在 这 个 阶段 ， 程 序 员 为 
面向 过 程 设计 中 的 模块 编写 程序 或 者 编写 程序 单元 ， 实 现 面 向 对 象 设计 中 的 类 。 在 每 种 情况 
中 ， 都 有 一 些 我 们 需要 提 及 的 问题 。 

10.4.1 语言 的 选择 


在 面向 过 程 开发 中 ， 工 程 团队 需要 从 第 9 章 所 讨论 的 面向 过 程 语言 中 选择 一 个 或 一 组 语 
言 。 虽 然 有 些 语言 〈 像 C++) 被 看 成 既是 面向 过 程 的 ， 又 是 面向 对 象 的 语言 ， 但 通常 实现 使 
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用 纯 过 程 语言 ， 如 C 语言 。 在 面向 对 象 的 情况 下 ，C++ 和 Java 的 使 用 都 很 普遍 。 


10.4.2 ”软件 质量 


在 实现 阶段 创建 的 软件 质量 是 一 个 非常 重要 的 问题 。 具 有 高 质量 的 软件 系统 是 一 个 能 满 
足 用 户 需求 、 符 合 组 织 操 作 标 准 和 能 高 效 运行 在 为 其 开发 的 硬件 上 的 一 个 软件 。 但 是 ， 如 果 
我 们 需要 取得 高 质量 的 软件 系统 ， 那 么 必须 能 定义 质量 的 一 些 属性 。 

软件 质量 因素 

软件 质量 能 够 划分 成 三 个 广义 的 度量 : 
可 操作 性 、 可 维护 性 和 可 迁移 性 。 每 个 度量 
如 图 10-10 所 示 还 可 以 展开 。 





软件 质量 





(1 ) 可 操作 性 口 准确 性 口 可 变性 口 重 用 性 
可 操作 性 涉及 系统 的 基本 操作 。 就 像 ”2 高 效 人 eg Se 
图 10-10 中 显示 的 一 样 ， 可 操作 性 有 多 种 安全 性 可 测试 性 


度量 方法 : 准确 性 、 高 效 性 、 可 靠 性 、 安 ” 口 及 时 性 
口 适 用 性 
全 、 及 时 性 和 适用 性 。 
e 不 准确 的 系统 比 没有 系统 更 糟糕 。 
任何 被 开发 的 系统 都 必须 经 过 系统 测试 工程 师 和 用 户 检测 。 准 确 性 能 够 通过 诸如 故 
障 平均 时 间 、 每 千 行 代码 错误 数 以 及 用 户 请 求 变更 数 这 样 的 测量 指标 来 度量 。 
e 高 效 性 大 体 上 是 个 主观 的 术语 。 在 一 些 实例 中 ， 用 户 将 指定 性 能 指标 ， 例 如 实时 响 
应 必须 在 1 秒 之 内 接收 到 ， 成 功率 在 95%。 它 显然 是 可 测量 的 。 
e 可 靠 性 实际 上 综合 了 其 他 各 种 因素 。 如 果 用 户 指望 系统 完成 工作 并 对 其 有 信心 ， 这 
时 它 就 是 最 可 靠 的 。 另 外 ， 一 些 度量 直接 说 明了 系统 的 可 靠 性 ， 最 显著 的 是 故障 平 
均 时 间 。 
。 一 个 系统 的 安全 性 是 以 未 经 授权 的 人 得 到 系统 数据 的 难 易 程度 为 参照 的 。 尽 管 这 是 
个 主观 的 领域 ， 但 仍然 有 可 核查 的 清单 帮助 评估 系统 的 安全 性 。 例 如 ， 系 统 有 并 且 
需要 密码 来 验证 用 户 吗 ? 
e 在 软件 工程 中 ， 及 时 性 意味 着 几 件 不 同 的 事情 。 系 统 及 时 传递 它 的 输出 了 吗 ? 对 于 
在 线 系统 ， 响 应 时 间 满 足 用 户 的 需求 了 吗 ? 
@ 适用 性 是 另 一 个 很 主观 的 领域 。 对 适用 性 的 最 好 度量 方法 是 观察 用 户 ， 看 他 们 是 如 
何 正在 使 用 这 个 系统 的 。 用 户 访谈 能 够 常常 发 现 系统 适用 性 上 的 问题 。 
(2 ) 可 维护 性 
可 维护 性 以 保持 系统 正常 运行 并 及 时 更 新 为 参照 。 很 多 系统 需要 经 常 修改 ， 这 不 是 因为 
它们 不 能 很 好 地 运行 而 是 因为 外 部 因素 的 改变 。 例 如 ， 一 个 公司 的 工资 单 系统 就 不 得 不 经 常 
修改 以 满足 政府 法 律 和 规则 的 改变 。 
e 可 变性 是 个 主观 因素 。 但 是 ， 一 个 有 经 验 的 项 目 领 导 可 以 估计 出 多 长 时 间 需 要 发 生 
一 次 改变 请 求 。 如 果 持 续 时 间 太 长 可 能 是 因为 系统 很 难 改变 。 这 一 点 对 于 老 系统 特 
别 正确 。 今 天 在 这 个 领域 有 很 多 软件 度量 工具 来 估算 程序 的 复杂 性 和 结构 。 
可 修正 性 的 一 种 度量 是 恢复 正常 的 平均 时 间 ， 也 就 是 当 程序 发 生 故 障 后 使 程序 恢复 
运行 所 花费 的 时 间 。 虽 然 它 是 反应 性 定义 ， 但 目前 还 没有 手段 来 预测 从 故障 中 改正 
程序 需要 花 多 长 时 间 。 


图 10-10 质量 因素 
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e 用 户 经 常 要 求 在 系统 中 进行 变动 。 适 应 性 是 个 定性 的 属性 ， 试 图 度量 进行 这 些 变动 
的 难 易 程度 。 如 果 一 个 系统 需要 完全 重 写 程序 来 进行 改变 ， 那 它 就 没有 灵活 性 。 
e 你 可 能 会 认为 可 测试 性 是 个 很 主观 的 领域 ， 但 测试 工程 师 有 包含 各 种 因素 的 检测 清 
单 来 评估 系统 的 可 测试 性 。 
(3 ) 可 迁移 性 
可 迁移 性 是 指 把 数据 和 (或 ) 系统 从 一 个 平台 移动 到 另 一 个 平台 并 重用 代码 的 能 力 。 在 
很 多 情况 下 ， 这 不 是 一 个 很 重要 的 因素 。 另 一 方面 ， 如 果 你 编写 具 用 通用 性 的 软件 ， 那 么 可 
迁移 性 就 很 关键 了 。 
e 如 果 编 写 的 函数 可 以 在 不 同 的 程序 和 不 同 的 项 目 中 使 用 ， 那 么 它 具 有 很 好 的 重用 性 
好 的 程序 员 建 立 函 数 库 以 便 在 解决 类 似 的 问题 时 能 够 重用 这 些 函 数 。 
@ 互 用 性 是 发 送 数据 给 其 他 系统 的 能 力 。 在 当今 高 度 集成 的 系统 中 ， 这 是 非常 需要 的 
属性 。 事 实 上 ， 它 已 经 变 得 如 此 重要 以 至 操作 系统 现在 都 支持 系统 之 间 传 递 数据 的 
能 力 ， 例 如 在 文字 处 理 软件 和 电子 数据 表 之 间 传 递 数 据 。 
@ 可 移植 性 是 一 种 把 软件 从 一 个 硬件 平台 转移 到 另 一 个 硬件 平台 的 能 力 。 


10.5 ”测试 阶段 
测试 阶段 的 目标 就 是 发 现 错误 ， 这 就 意味 着 良好 






的 测试 策略 能 发 现 最 多 的 错误 。 有 两 种 测试 : 白 盒 测 
试 和 黑 盒 测试 (图 10-11 ) 。 口 基 本 路 径 口 穷尽 测试 
口 控制 结构 口 随机 测试 
10.5.1 ” 自 盒 测试 口 边界 值 测试 
图 10-11 软件 测试 


白 盒 测 试 (或 玻璃 盒 测 试 ) 是 基于 知道 软件 内 部 
结构 的 。 测 试 的 目标 是 检查 软件 所 有 的 部 分 是 否 全 部 设计 出 来 。 白 盒 测 试 假定 测试 者 知道 有 
关 软 件 的 一 切 。 在 这 种 情况 下 ， 程 序 就 像 玻璃 盒子 ， 其 中 的 每 件 事 都 是 可 见 的 。 白 盒 测试 由 
软件 工程 师 或 一 个 专门 的 团队 来 完成 。 使 用 软件 结构 的 白 盒 测 试 需要 保证 至 少 满 足下 面 4 条 
标准 : 

e 每 个 模块 中 的 所 有 独立 的 路 径 至 少 被 测试 过 一 次 。 

e 所 有 的 判断 结构 (两 路 的 或 多 路 的 ) 每 个 分 支 都 被 测试 。 

e 每 个 循环 被 测试 。 

e 所 有 数据 结构 都 被 测试 。 

在 过 去 , 已 经 有 多 种 测试 方法 ， 我们 只 讨论 其 中 的 两 种 : 基本 路 径 测试 和 控制 结构 
测试 。 

1. 基本 路 径 测 试 

基本 路 径 测试 是 由 Tom McCabe 提出 的 。 这 种 方法 创建 一 组 测试 用 例 ， 这 些 用 例 执行 软 
件 中 的 每 条 语句 至 少 一 次 。 

基本 路 径 测 试 是 一 种 软件 中 每 条 语句 至 少 被 执行 一 次 的 方法 。 

基本 路 径 测 试 使 用 图 论 (参见 第 12 章 ) 和 图 复杂 性 找到 必须 被 走 过 的 独立 路 径 ， 从 而 
保证 每 条 语句 至 少 被 执行 一 次 。 

例 10.1 为 了 给 出 基本 路 径 测试 的 理念 和 找到 部 分 程序 中 的 独立 路 径 ， 假 定 系统 只 由 
一 个 程序 构成 ， 程 序 只 有 一 个 单 循环 ， 它 被 用 UML 图 显示 在 图 10-12 中 。 
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图 10-12 基本 路 径 测 试 的 一 个 例子 


在 这 个 简单 的 程序 中 ， 有 3 条 独立 路 径 。 第 一 条 是 循环 被 跳 过 的 情况 。 第 二 条 是 通过 判 
断 结构 的 右 分 支 ， 循 环 被 执行 一 次 。 第 三 条 是 通过 判断 结构 的 左 分支 ， 循 环 被 执行 一 次 。 如 
果 有 更 多 的 重复 ， 那 创建 的 路 径 是 不 独立 于 这 三 条 路 径 的 : 如 果 我 们 把 UML 图 改 成 流程 图 ， 
这 个 是 可 以 证 明 的 ， 但 我 们 必须 把 证 明 留 给 关于 软件 工程 的 书 。 设 计 测试 用 例 的 理念 就 是 覆 
盖 基 本 路 径 集中 的 所 有 3 条 路 径 ， 这 样 所 有 语句 至 少 被 执行 一 次 。 

2. 控制 结构 测试 

控制 结构 测试 比 基 本 路 径 测试 更 容易 理解 并 且 包含 基 本 路 径 测试 ， 这 种 方法 使 用 下 面 将 
要 简要 讨论 的 不 同类 的 测试 。 

(1) 条件 测试 

条 件 测试 应 用 于 模块 中 的 条 件 表达 式 ， 简 单条 件 是 关系 表达 式 ， 而 复合 条 件 是 简单 条 件 
和 逻辑 运算 符 (参见 第 9 章 ) 的 组 合 。 条 件 测试 用 来 检查 是 否 所 有 的 条 件 都 被 正确 设置 。 

(2 ) 数据 流 测试 

数据 流 测试 是 基于 通过 模块 的 数据 流 的 。 这 种 测试 选择 测试 用 例 ， 这 些 用 例 涉及 检查 被 
用 在 赋值 语句 左边 的 变量 的 值 。 

(3 ) 循环 测试 

循环 测试 使 用 测试 用 例 检 查 循环 的 正确 性 。 所 有 类 型 的 循环 ( while、do 和 for) 被 仔细 
测试 。 


10.5.2” 黑 盒 测试 


黑 盒 测试 在 不 知道 程序 的 内 部 也 不 知道 程序 是 怎样 工作 的 情况 下 测试 程序 。 换 言 之 ， 程 
序 就 像 看 不 见 内 部 的 黑 盒 。 黑 盒 测试 按照 软件 应 该 完成 的 功能 来 测试 软件 ， 如 它 的 输入 和 输 
出 。 下 面 介绍 几 种 黑 盒 测试 方法 。 

1. 穷尽 测试 

最 好 的 黑 盒 测试 方法 就 是 用 输入 域 中 的 所 有 可 能 的 值 去 测试 软件 。 但 是 ， 在 复杂 的 软件 
中 ， 输 入 域 是 如 此 巨大 ， 这 样 做 常常 不 现实 。 

2. 随机 测试 

在 随机 测试 中 ， 选 择 输入 域 的 值 的 子 集 来 测试 ， 子 集 选 择 的 方式 ( 值 在 输入 域 上 的 分 布 ) 
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是 非常 重要 的 。 在 这 种 情况 下 ， 随 机 数 生 成 器 是 非常 有 用 的 。 

3. 边界 值 测试 

当 遇 到 边界 值 时 ， 错 误 经 常 发 生 。 例 如 ， 一 个 模块 定义 它 的 输入 必须 大 于 或 等 于 100， 
那 这 个 模块 用 边界 值 100 来 测试 就 非常 重要 。 如 果 模 块 在 边界 值 出 错 ， 那 有 可 能 就 是 模块 代 
码 中 的 有 些 条 件 ， 例 如 ，x 三 100 被 写成 x > 100。 


10.6 文档 


软件 的 正确 使 用 和 有 效 维护 离 不 开 文档 。 通 常 软件 有 三 种 独立 的 文档 : 用 户 文档 、 系 
统 文档 和 技术 文档 。 注 意 文档 是 一 个 持续 的 过 程 。 如 果 软 件 在 发 布 之 后 有 问题 ， 也 必须 写 文 
档 。 如 果 软 件 被 修改 ,那么 所 有 的 修改 和 与 原 软件 包间 的 关系 都 要 被 写 进 文档 。 只 有 当 软 件 
包 过 时 后 ， 编 写 文 档 才 停止 。 

文档 是 一 个 持续 的 过 程 。 


10.6.1 ”用户 文 档 


为 了 软件 包 正 常 运 行 ， 传 统 上 称 为 用 户 手册 的 文档 对 用 户 是 必 不 可 少 的 。 它 告诉 用 户 如 
何 一 步 步 地 使 用 软件 包 。 它 通常 包含 一 个 教程 指导 用 户 熟悉 软件 包 的 各 项 特性 。 
一 个 好 的 用 户 手册 能 够 成 为 一 个 功能 强大 的 营销 工具 。 用 户 文档 在 营销 中 的 重要 性 再 强 
调 也 不 过 分 。 手 册 应 该 面向 新 手 和 专业 用 户 。 配 有 好 的 用 户 文档 必定 有 利于 软件 的 销量 。 


10.6.2 ”系统 文档 


系统 文档 定义 软件 本 身 。 撰 写 系统 文 档 的 目的 是 为 了 让 原始 开发 人 员 之 外 的 人 能 够 维护 
和 修改 软件 包 。 系 统 文档 在 系统 开发 的 所 有 4 个 阶段 都 应 该 存在 。 

在 分 析 阶 段 ， 收 集 的 信息 应 该 仔细 地 用 文档 记录 。 另 外 ， 系 统 分 析 员 应 该 定义 信息 的 来 
源 。 需 求 和 选用 的 方法 必须 用 基于 它们 的 推论 来 清楚 表述 。 

在 设计 阶段 ， 最 终 版 本 中 用 到 的 工具 必须 记录 在 文档 中 。 例 如 ， 如 果 结 构图 修改 了 多 
次 ， 那 么 最终 的 版 本 要 用 完整 的 注释 记录 在 案 。 

在 实现 阶段 ， 代 码 的 每 个 模块 都 应 记录 在 文档 中 。 男 外 ， 代 码 应 该 使 用 注释 和 描述 头 尽 
可 能 详细 地 形成 自 文档 。 

最 后 ， 开 发 人 员 必 须 仔细 地 形成 测试 阶段 的 文档 。 对 最 终 产品 使 用 的 每 种 测试 ， 连 同 它 
的 结果 都 要 记录 在 文档 中 。 甚 至 令 人 不 快 的 结果 和 产生 它们 的 数据 也 要 记录 在 案 。 


10.6.3 ”技术 文档 

技术 文档 描述 了 软件 系统 的 安装 和 服务 。 安 装 文档 描述 了 软件 如 何 安装 在 每 台 计 算 机 
上 ， 如 服务 器 和 客户 端 。 服 务 文档 描述 了 如 果 需 要 ， 系 统 应 该 如 何 维 护 和 更 新 。 
10.7 章 末 材料 
推荐 读物 


有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
® Braude, E. Software Engineering - An Object-Oriented Perspective, New York: Wiley, 
2001 
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小 测验 


Gustafson, D. Software Engineering, New York: McGraw-Hill, 2002 

Lethbridge, T. and Laganiere, R. Object-Oriented Software Engineering, New York: 
McGraw-Hill, 2005 

Pressman, R. Software Engineering: A Practitioner’s Approach, New York: McGraw- 
Hill, 2005 

Schach, S$. Object-Oriented and Classical Software Engineering, New York: McGraw- 
Hill, 2007 


软件 生命 周期 是 软件 工程 中 的 基本 概念 ， 像 许多 产品 一 样 ， 软 件 也 经 历 一 个 重复 阶 
段 的 周期 。 

在 软件 生命 周期 中 ， 开 发 过 程 包括 4 个 阶段 : 分 析 、 设 计 、 实 现 和 测试 。 在 这 些 阶 
段 中 都 有 一 些 相关 的 模型 被 使 用 。 我 们 讨论 两 种 最 通用 的 : 瀑布 模型 和 增 量 模型 。 
整个 开发 过 程 始 于 分 析 阶 段 ， 这 个 阶段 产生 了 规格 说 明文 档 ， 这 个 文档 说 明了 软件 
要 做 什么 ， 而 没有 说 明 如 何 去 做 。 分 析 阶 段 可 以 使 用 两 种 方法 : 面向 过 程 分 析 和 面 
向 对 象 分 析 。 

设计 阶段 定义 了 系统 如 何 完成 在 分 析 阶 段 所 定义 的 。 在 面向 过 程 设 计 中 ， 整 个 工程 
被 分 解 成 一 组 过 程 或 模块 。 在 面向 对 象 设计 中 ,设计 阶 段 通过 详细 列 出 类 中 的 细节 
而 继续 。 

模块 化 是 将 大 程序 分 解 成 能 理解 和 容易 处 理 的 小 程序 。 当 系统 被 分 解 成 模块 时 ， 有 
两 个 问题 很 重要 : 耦合 和 内 聚 。 耦 合 是 对 两 个 模块 互相 绑 定 紧密 程度 的 度量 。 在 软 
件 系统 中 的 模块 间 的 耦合 必须 最 小 化 。 内 聚 是 程序 中 处 理 过 程 相关 紧密 程度 的 度量 。 
在 软件 系统 中 的 模块 间 的 内 聚 必须 最 大 化 。 

在 实现 阶段 ， 程 序 员 为 面向 过 程 设计 中 的 模块 编写 代码 或 编写 程序 单元 ， 实 现 面向 
对 象 设 计 的 类 。 

软件 质量 非常 重要 。 软 件 质量 能 够 划分 成 三 个 广义 的 度量 : 可 操作 性 、 可 维护 性 和 
可 迁移 性 。 

测试 阶段 的 目标 就 是 发 现 错误 ， 有 两 类 测试 : 白 盒 测试 和 黑 盒 测试 。 白 盒 测 试 (或 
玻璃 盒 测 试 ) 是 基于 知道 软件 的 内 部 结构 的 。 白 盒 测 试 假定 测试 者 知道 一 切 。 黑 盒 
测试 在 不 知道 内 部 是 什么 ， 也 不 知道 它 是 如 何 工作 的 情况 下 测试 软件 。. 


练习 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 试 题 。 强 烈 建议 学 生 在 继续 本 章 习题 前 首先 
完成 相关 测验 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 定义 


“软件 生命 周期 ”。 


2. 区 分 瀑布 模型 和 增 量 开发 模型 。 
3. 软件 开发 的 4 个 阶段 是 什么 ? 
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4. 说 明 分 析 阶 段 的 目标 ， 描 述 此 阶段 中 的 两 种 趋势 。 
5. 说 明 设计 阶段 的 目标 ， 描 述 此 阶段 中 的 两 种 趋势 。 
6. 描述 模块 化 ， 说 出 与 模块 化 有 关 的 两 个 问题 。 

7. 描述 耦合 和 内 聚 之 间 的 区 别 。 

8. 说 明 实 现 阶段 的 目标 ， 描 述 此 阶段 中 的 质量 问题 。 
9. 说 明 测试 阶段 的 目标 ， 列 出 两 类 测试 。 

10. 描述 白 盒 测 试 和 黑 盒 测 试 之 间 的 区 别 。 


练习 题 


1. 在 第 9 章 中 ， 我 们 解释 了 常量 的 使 用 比 字面 值 更 受 欢 迎 。 这 种 偏好 对 软件 生命 周期 的 影响 是 什么 ? 

2. 在 第 9 章 中 ， 我 们 说 明了 模块 间 的 通信 可 以 通过 传 值 或 传 引 用 来 进行 。 哪 一 种 提供 了 模块 间 更 少 的 
耦合 ? 

3. 在 第 9 章 中 ,我们 说 明了 模块 间 的 通信 可 以 通过 传 值 或 传 引用 来 进行 。 哪 一 种 提供 了 模块 间 更 多 的 

内 聚 ? 

画 出 一 个 简单 图 书馆 的 用 例 图 。 

. 画 出 一 个 小 杂货 店 的 用 例 图 。 

显示 简单 数学 公式 x+ 了 的 数据 流 图 。 

显示 简单 数学 公式 xX》 +zXt 的 数据 流 图 。 

. 显示 图 书馆 的 数据 流 图 。 

. 显示 小 杂货 店 的 数据 流 图 。 

10. 创建 练习 题 8 的 结构 图 。 

11. 创建 练习 题 9 的 结构 图 。 

2. 显示 固定 容量 的 堆栈 (参见 第 12 章 ) 的 状态 图 。 

3. 显示 固定 容量 的 队列 (参见 第 12 章 ) 的 状态 图 。 

14. 创建 图 书馆 的 类 图 。 

15. 创建 小 杂货 店 的 类 图 。 

16. 显示 练习 题 14 中 类 的 细节 。 

17. 显示 练习 题 15 中 类 的 细节 。 

18. 一 个 程序 的 输入 由 1000 到 1999 范围 (包含 ) 中 的 三 个 整数 构成 。 求 出 测试 这 些 数字 的 所 有 组 合 的 
穷尽 测试 的 数目 。 

19. 列 出 练习 题 18 中 所 需要 的 边界 值 测 试 。 

20. 一 个 随机 数 生成 器 能 生成 0 到 0.999 间 的 一 个 数 。 该 随机 数 生成 器 是 如 何 用 来 做 练习 题 18 中 所 描 
述 的 系统 的 随机 测试 的 ? 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概 念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通 过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨论 材料 的 理解 。 


| 第 1 章 
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数据 结构 





在 前 面 的 章节 中 ， 我 们 使 用 变量 来 存储 单个 实体 ， 尽 管 单 变量 在 程序 设计 语言 中 被 大 量 
使 用 ， 但 它们 不 能 有 效 地 解决 复杂 问题 。 本 章 将 介绍 数据 结构 ， 它 是 第 12 章 抽象 数据 类 型 
(abstact data type，ADT) 的 前 奏 。 

数据 结构 利用 了 有 关 的 变量 的 集合 ， 而 这 些 集合 能 够 单独 或 作为 一 个 整体 被 访问 。 换 句 
话说 ， 一 个 数据 结构 代表 了 有 特殊 关系 的 数据 的 集合 。 本 章 将 讨论 三 种 数据 结构 : 数组 、 记 
录 和 和 链表， 大 多 的 编程 语言 都 隐 式 实现 了 前 两 种 而 第 三 种 则 通过 指针 和 记录 来 模拟 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

e 定义 数据 结构 ; . 

把 数组 定义 为 数据 结构 ， 并 说 明 它 是 如 何 用 于 存储 数据 项 列表 的 ; 

区 分 数组 的 名 字 和 数组 中 元 素 的 名 字 ; 

描述 为 数组 定义 的 操作 ; 

把 记录 定义 为 数据 结构 ， 并 说 明 它 是 如 何 用 于 存储 属于 单个 数据 元 素 的 属性 ; 
区 分 记录 的 名 字 和 它 的 域 的 名 字 ; 

把 链表 定义 为 数据 结构 ， 并 说 明 它 是 如 何 用 指针 来 实现 的 ; 

理解 数组 中 节点 的 存 取 机 制 ; 

描述 为 链表 定义 的 操作 ; 

比较 和 区 分 数组 、 记 录 和 链表 ; 

说 明 数 组 、 记 录 和 链表 的 应 用 。 


11.1 数组 


假设 有 100 个 分 数 ， 我 们 需要 读 人 这 些 数 ， 处 理 它们 并 打印 。 同 时 还 要 求 将 这 100 个 
分 数 在 处 理 过 程 中 保留 在 内 存 中 。 可 以 定义 100 个 变量 ， 每 个 都 有 不 同 的 名 字 ， 如 图 11-1 
所 示 。 

但 是 定义 100 个 不 同 的 变量 名 带 来 了 其 他 问题 ， 我 们 需要 100 个 引用 来 读 它 们 ; 需要 
100 个 引用 来 处 理 它们 ; 需要 100 个 引用 来 写 它 们 。 图 11-2 给 出 了 说 明 这 个 问题 的 示意 图 。 


















开始 
分 数 1 后 处 理 分 数 1 CC 写 分 数 ! ) 
分 数 2 加 本 于 和 站 : : : 
: (” 读 分 数 100 ) 处 理 分 数 100 (号 分 数 100 ) 
分 数 100 国王 殉 要 到 
和 下 


图 11-1 100 个 独立 变量 图 11-2 独立 变量 的 处 理 
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即使 是 处 理 这 些 数 目 相 对 较 小 的 分 数 ， 我 们 需要 的 指令 数目 也 是 无 法 接受 的 。 为 了 处 理 
大 量 的 数据 ， 需 要 一 个 数据 结构 ， 如 数组 。 

数组 是 元 素 的 顺序 集合 ， 通 常 这 些 元 素 具有 相同 的 数据 类 型 。 虽然 有 些 编程 语言 允许 
在 一 个 数据 中 可 以 有 不 同类 型 的 元 素 。 我 们 可 以 称 数组 中 的 元 素 为 第 一 个 元 素 、 第 二 个 元 素 
等 ， 直 到 最 后 一 个 元 素 。 如 果 将 100 个 分 数 放 进 数组 
中 ， 可 以 指定 元 素 为 scores[1] 、scores[2]， 等 等 。 索 引 
表示 元 素 在 数组 中 的 顺序 号 ， 顺 序号 从 数组 开始 处 计 _ 、 


scores[2] | 





数 。 数 组 元 素 通 过 索引 被 独立 给 出 了 地 址 (图 11.3)， 
这 个 数组 整体 上 有 个 名 称 : scores， 但 每 个 数 可 以 利 scores[100]| 
用 它 的 索引 来 单独 访问 。 

我 们 可 以 使 用 循环 来 读 写 数组 中 的 元 素 ， 也 可 图 11-3 带 索引 的 数组 


以 使 用 循环 来 处 理 元 素 。 现 在 我 们 可 以 不 管 要 处 理 的 元 素 是 100 个 、1000 个 或 10 000 
个 ， 循 环 使 得 处 理 它们 变 得 容易 。 我 们 可 以 使 用 一 个 整数 变量 来 控制 循环 ， 只 要 变量 的 值 
小 于 数组 中 元 素 的 个 数 ， 那 还 在 循环 体 里 面 
(图 11-4 )。 

我 们 是 从 1 开始 使 用 数组 索引 的 ， 

但 有 些 现代 语言 (如 C、C++ 和 Java) 

是 从 0 开始 数组 索引 的 。 ee i 

例 11.1 比较 处 理 图 11-2 中 的 100 个 
独立 元 素 所 需 的 指令 条 数 和 处 理 图 11-4 中 
的 数组 中 的 100 个 元 素 所 需 的 指令 条 数 。 ee [i 
假定 处 理 每 个 分 数 只 需要 一 条 指令 。 

解 

。 在 第 一 种 情况 下 ， 需 要 100 条 指令 

去 读 ; 100 条 指令 去 写 ; 100 条 指令 (es 

去 处 理 。 总 共 的 指令 条 数 是 300。 
。 在 第 二 种 情况 下 ， 有 三 个 循环 ， 每 1 

个 循环 中 有 两 条 指令 ， 共 6 条 指令 。 但 是 ， 我 们 还 需要 3 条 指令 来 初始 化 索引 ，3 条 

指令 来 检查 索引 的 值 ， 所 以 总 共有 12 条 指令 。 

例 11.2 ”如 果 使 用 数组 ， 计 算 机 需要 执行 的 周期 次 数 ( 取 数 、 译 码 和 执行 阶段 ) 并 没有 
减少 ， 周 期 的 次 数 实际 上 还 增加 了 ， 因 为 我 们 有 额外 的 初始 化 、 增 量 和 测试 索引 的 值 的 负 
担 。 但 是 我 们 关心 的 不 是 周期 的 次 数 ， 而 是 我 们 需要 写 的 程序 的 行 数 。 

例 11.3 在 计算 机 科学 中 ， 有 一 个 很 大 的 问题 就 是 程序 的 重用 性 ， 例 如 ， 如 果 数 据 项 
的 数目 改变 了 ， 程 序 中 有 多 少 需要 修改 的 地 方 。 假 定 我 们 写 了 两 个 程序 分 别处 理 图 11-2 和 
图 11-4 中 的 分 数 ， 如 果 分 数 的 数目 由 100 变 成 1000， 我们 需要 在 每 个 程序 中 做 多 少 修改 ? 

在 第 一 个 程序 中 ， 需 要 增加 3X900=2700 条 指令 ; 在 第 二 个 程序 中 ， 只 需要 修改 三 个 条 
件 (7 > 100 到 了 > 1000 )。 我 们 实际 上 能 修改 图 11-4 中 的 流程 图 ， 使 得 要 修改 的 数目 为 1。 


11.1.1 数组 名 与 元 素 名 
在 一 个 数组 中 ， 有 两 种 标识 符 : 数组 的 名 字 和 各 个 元 素 的 名 字 。 数 组 名 是 整个 结构 的 名 








写 scores[ 门 


发 据 结 鸭 199 


字 ， 而 元 素 的 名 字 人 允许 我 们 查阅 这 个 元 素 。 在 图 11-3 的 数组 中 ， 数 组 的 名 字 是 scores， 而 
每 个 元 素 的 名 字 是 这 个 名 字 后 面 跟 索引 ， 如 scores[1] 、scores[2] 等 。 在 本 章 中 ， 我们 大 部 分 
需要 的 是 元 素 的 名 字 ， 但 是 ， 在 有 些 语言 (如 C) 中 ， 也 需要 使 用 数组 的 名 字 。 


11.1.2 ”多 维 数组 


到 目前 为 止 ， 我 们 所 讨论 的 都 是 一 维 数 第 一 维 

组 ， 因 为 数据 仅 是 在 一 个 方向 上 线性 组 成 。 许 RE scores[2][3] 
多 的 应 用 要 求 数据 存储 在 多 维 中 。 常 见 的 例 [1] [2] [3] 内 
子 如 表格 ， 就 是 包括 行 和 列 的 数组 。 图 11-5 D 





给 出 了 一 个 表格 ， 通 常 称 为 二 维 数 组 。 Se [3] 
图 11-5 中 数组 包含 了 一 个 班级 的 学 生成 [4] 
绩 。 这 个 班级 有 5 位 学 生 ， 每 个 学 生 有 4 种 5 
测验 的 不 同 成 绩 。 变 量 scores[2][3] 显示 了 第 A 
二 个 学 生 在 第 三 次 测验 中 的 成 绩 。 把 成 绩 组 图 TS 二 坑 数 纪 


织 成 二 维 数组 有 助 于 教师 发 现 每 个 学 生 的 平均 成 绩 ( 行 值 上 的 平均 ) 和 每 次 测验 的 平均 成 绩 
( 列 值 上 的 平均 )， 还 有 所 有 测验 的 平均 成 绩 ( 整 表 的 平均 )。 
多 维 数组 (多 于 二 维 的 数组 ) 也 是 可 以 的 。 但 是 ， 在 本 书 中 我 们 不 讨论 多 于 二 维 的 数组 。 


11.1.3 ”存储 配置 


一 维 数组 的 索引 直接 定义 了 元 素 在 实际 存储 上 的 相对 位 置 。 但 是 二 维 数组 表示 行 和 列 。 
在 内 存 中 如 何 存储 每 个 元 素 取决 于 计算 
机 ， 大 多 数 计算 机 使 用 行 主 序 存储 ， 其 中 
数组 的 一 个 整 行 在 内 存 上 存储 在 下 一 个 行 
之 前 。 但 是 计算 机 也 可 以 使 用 列 主 序 存 
储 ， 其 中 一 个 整 列 在 内 存 上 存储 在 下 一 个 
列 之 前 。 图 11-6 显示 了 一 个 二 维 数组 以 
及 它 是 如 何以 行 主 序 存储 和 列 主 序 存储 
的 。 行 主 序 存储 更 常见 些 。 

例 11.4 ”我 们 在 内 存 上 有 一 个 二 维 数 图 11-6 数组 的 存储 配置 
组 students。 数 组 是 100X4 的 (100 行 和 4 列 )。 假 定 元 素 students[1][1] 是 存储 在 存储 介质 
上 ， 地 址 为 1000， 每 个 元 素 只 占 一 个 存储 地 址 ， 求 元 素 students[5][3] 的 地 址 。 计 算 机 使 用 
行 主 序 存储 。 

解 ” 假 定 每 个 元 素 只 占 一 个 存储 地 址 ， 我 们 能 使 用 下 列 公 式 找 到 元 素 的 地 址 : 

y=x+ ColsX(i-1)+ (7-1) 

这 里 x 表示 开始 地 址 ，Cols 表示 数组 中 列 的 数目 , i 表示 元 素 的 行 号 , j 表示 元 素 的 列 号 ， 
而 yy 就 是 要 找 的 地 址 。 在 本 例 中 , x 为 1000，Cols 为 4, i 为 5, j 为 3， 要 找 的 y 是 : 

y=x+ ColsX(i-1)+ (0-1)=1000 + 4(5-1) + (3-1)=1018 

因为 我 们 的 元 素 是 处 在 第 5 行 和 第 3 列 上 ， 所 以 我 们 的 答案 是 有 道理 的 。 在 这 个 元 素 的 
前 面 有 4 行 ， 占 据 了 16 (4X4) 个 存储 地 址 。 第 5 行 的 前 两 列 也 占据 了 两 个 地 址 。 这 就 意 
味 着 在 目标 元 素 前 的 所 有 元 素 占 据 了 18 个 存储 地 址 。 如 果 第 一 个 元 素 占据 的 地 址 为 1000， 
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那么 目标 元 素 占 据 的 地 址 就 是 1018。 


11.1.4 ”数组 操作 


虽然 我 们 能 应 用 一 些 为 数组 中 每 个 元 素 定义 的 通常 操作 (参见 第 4 章 )， 但 我 们 还 能 定 
义 一 些 把 数组 作为 数据 结构 的 操作 ， 数 组 作为 结构 的 常用 操作 有 : 查找、 插入、 删除、 检索 
和 遍历 。 

1. 查找 元 素 

当 我 们 知道 元 素 的 值 时 ， 经 常 需要 找到 元 素 的 序号 。 这 种 操作 在 第 8 章 讨论 过 。 我 们 可 以 
对 未 排序 的 数组 使 用 顺序 查找 ， 对 排序 的 数组 使 用 折 半 查找 。 下 面 三 种 操作 都 要 使 用 查找 操作 。 

2. 元 素 的 插 人 

通常 ， 计 算 机 语言 要 求 数组 的 大 小 (数组 中 元 素 的 个 数 ) 在 程序 被 写 的 时 候 就 被 定义 ， 
防止 在 程序 的 执行 过 程 中 被 修改 。 最 近 ， 有 些 语言 允许 可 变 长 数组 (例如,，C 语言 的 最 新 版 
本 )。 即 使 语言 允许 可 变 长 数组 ， 在 数组 中 插入 一 个 元 素 仍 需要 十 分 小 心 。 

( 1) 尾部 插入 

如 果 插 入 操作 在 数组 尾部 进行 ， 而 且 语 言 允 许 增加 数组 的 大 小 ， 那 么 可 以 很 容易 完成 这 
个 操作 。 例 如 ， 如 果 一 个 数组 中 有 30 个 元 素 ， 我 们 把 数组 的 大 小 增 到 31， 并 把 新 数据 项 作 
为 第 31 项 插入。 

(2 ) 开始 或 中 间 插 入 

如 果 插 入 是 在 数组 的 开始 或 中 间 ， 过 程 就 是 元 长 的 和 花费 时 间 的 。 当 我 们 需要 在 一 个 有 
序 的 数组 中 插入 一 个 元 素 时 ， 这 就 发 生 了 。 就 像 前 面 描述 的 ， 首 先 查 找 数组 。 找 到 插入 的 位 
置 后 ， 插 人 新 的 元 素 。 例 如 ， 如 果 要 在 30 个 元 素 的 数组 中 插入 一 个 新 的 元 素 ， 作 为 第 9 个 
元 素 ， 那么 9 ~ 30 的 元 素 应 该 同 数组 尾部 移动 一 个 元 素 ， 以 留 出 第 9 个 元 素 的 位 置 用 来 插 
和 。 下 面 显 示 了 需要 被 应 用 于 数组 的 部 分 伪 代码 

二 0 

while (i 二 9) 

{ 

array[i+1] < array[il] 
"i 

} 

array[i] < newValue 
注意 移 位 需要 在 数组 的 尾部 进行 ， 以 防止 元 素 值 的 丢失 。 代 码 首先 把 第 30 个 元 素 的 值 复制 
到 第 31 个 元 素 中 ， 接 着 复制 第 29 个 元 素 的 值 到 第 30 个 元 素 中 ， 等 等 。 当 代码 离开 循环 时 ， 
第 9 个 元 素 的 值 已 经 复制 到 第 10 个 元 素 中 。 最 后 一 行 把 新 数据 项 的 值 复制 到 第 9 个 元 素 中 。 

3. 元 素 的 删除 

在 数组 中 删除 一 个 元 素 就 像 插入 操作 一 样 元 长 和 蒜 手 。 例 如 ， 如 果 要 删除 第 9 个 元 素 ， 
则 需要 把 第 10 个 元 素 到 第 30 个 元 素 向 数组 的 开始 位 置 移动 一 个 位 置 。 我 们 把 这 个 操作 的 伪 
代码 留 作 练 习 ， 它 与 增加 一 个 元 素 相似 。 

4. 检索 元 素 

检索 操作 就 是 随便 地 存 取 一 个 元 素 ， 达 到 检查 或 复制 元 素 中 的 数据 的 目的 。 与 插入 和 
删除 操作 不 同 ， 当 数据 结构 是 数组 时 ， 检 索 是 一 个 容易 的 操作 。 实 际 上 ， 数 据 是 随机 存 取 结 
构 ， 这 意味 着 数组 的 每 个 元 素 可 以 随机 地 被 存 取 ， 而 不 需要 存 取 该 元 素 前 面 的 元 素 或 后 面 的 
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元 素 。 例 如 ， 如 果 需 要 检索 数组 中 的 第 9 个 元 素 的 值 ， 只 用 一 条 指令 就 能 做 到 。 显 示 如 下 : 


RetrieveValue <- array[9] 


S. 数组 的 遍历 

数组 的 遍历 是 指 被 应 用 于 数组 中 每 个 元 素 上 的 操作 ， 如 读 、 写 、 应 用 数学 的 运算 等 。 

算法 11.1 给 出 了 求 数组 中 元 素 的 平均 值 的 例子 ， 数 组 的 元 素 是 实数 。 算 法 首先 使 用 循 
环 求 出 元 素 的 和 ， 循 环 结束 后 ， 求 得 平均 值 ， 它 是 和 除 以 元 素 的 个 数 。 注 意 : 为 了 正确 计算 
和 ， 在 循环 前 ， 需 要 设置 为 和 0.0。 


算法 11.1 计算 数组 中 元 素 的 平均 值 


算法 : ArrayAverage (Array,n) 
目的 : 求 平均 值 
前 提 : 给 定 一 个 数组 Array 和 元 素 的 个 数 n 


: 无 
返回 : 平均 值 


sum 全 0.0 

Ee ni 

while (i < n) 

{ 
sum sum + Array[il] 
zt 一 守 +1IL 

} 

average sum /'n 

Return (average) 


} 


11.1.5 ”数组 的 应 用 


考虑 一 下 前 一 节 所 讨论 的 操作 ， 就 给 出 了 数组 应 用 的 提示 。 如 果 有 一 个 表 ， 在 表 创建 后 
有 大 量 的 插入 和 删除 操作 要 进行 ， 这 时 就 不 应 该 使 用 数组 。 当 删除 和 插入 操作 较 少 ， 而 有 大 
i 






11.2 记录 


记录 是 一 组 相关 元 素 的 集合 ， 它 们 可 能 是 不 同 的 类 型 ， 但 整个 记录 有 一 个 名 称 。 记 录 
中 的 每 个 元 素 称 为 域 。 域 是 具有 含义 的 最 小 命名 数据 。 它 有 类 型 且 存 在 于 内 存 中 。 它 能 被 赋 
值 ， 反 之 也 能 够 被 选择 和 操纵 。 域 不 同 于 变量 主要 在 于 它 是 记录 的 一 部 分 。 

图 11-7 中 给 出 了 两 个 记录 的 实例 。 第 一 个 例子 : fraction 记录 ， 它 有 两 个 域 ， 都 是 整 型 。 
第 二 个 例子 : student 记录 ， 它 有 三 个 域 ， 包 
含 了 两 种 不 同 的 数据 类 型 。 | 








fraction 


记录 中 的 数据 必须 都 与 一 个 对 象 关联 。 图 11.7 记录 
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在 图 11-7 中 ，fraction 中 的 整数 都 属于 同一 个 fraction 对 象 ， 而 第 二 个 例子 的 数据 则 都 与 
student 关联 。( 注 意 我 们 把 字符 串 放 在 双 引 号 之 间 ， 而 单个 字符 放 在 单 引号 之 间 ， 这 个 是 大 
多 数 编程 语言 通常 使 用 的 。) 


11.2.1 记录 名 与 域名 


就 像 数 组 一 样 ， 在 记录 中 也 有 两 种 标识 符 : 记录 的 名 字 和 记录 中 各 个 域 的 名 字 。 记 录 的 
名 字 是 整个 结构 的 名 字 ， 而 每 个 域 的 名 字 允 许 我 们 存 取 这 些 域 。 例 如 ， 图 11-7 的 student 记 
录 中 ,记录 的 名 字 是 student， 域 的 名 字 是 student.id、student.name 和 student.grade。 大 多 数 
编程 语言 使 用 点 (.) 来 分 隔 结构 (记录 ) 名 和 人 它 成 员 ( 域 ) 的 名 字 。 这 是 我 们 在 本 书 中 的 约定 。 
例 11.5 下 面 显 示 了 图 11-7 中 的 域 值 是 如 何 被 存储 的 。 


student.id < 2005 student.name + "G. Boole" student.grade  'A!' 


11.2.2 ”记录 与 数组 的 比较 


我 们 可 以 从 概念 上 对 数组 和 记录 进行 比较 。 这 样 有 助 于 我 们 理解 什么 时 候 应 该 使 用 数 
组 ,什么 时 候 应 该 使 用 记录 。 数 组 定义 了 元 素 的 集合 ， 而 记录 定义 了 元 素 可 以 确认 的 部 分 。 
例如 ， 数 组 可 以 定义 一 个 班级 的 学 生 (40 位 学 生 )， 而 记录 定义 了 学 生 不 同 的 属性 ， 如 标识 、 
姓名 或 成 绩 等 。 


11.2.3 ”记录 数组 


如 果 我 们 需要 定义 元 素 的 集合 ， 且 同时 需要 定义 元 素 的 属性 ， 那 么 可 以 使 用 记录 数组 。 
例如 ， 在 一 个 有 30 位 学 生 的 班级 中 ， 我 们 可 2 
以 有 一 个 30 个 记录 的 数组 ， 每 个 记录 表示 一 students [1] [om 
位 学 生 。 图 11-8 显示 了 一 个 具有 30 个 称 为 一 
students 的 学 生 记 录 的 数组 。 Wi ed 

在 记录 数组 中 ， 数 组 的 名 字 定 义 了 整个 
结构 ， 作 为 一 个 整体 的 学 生 组 。 为 了 定义 每 
个 元 素 ， 我 们 需要 使 用 相应 的 索引 。 为 了 定 sudeats 301 症 一 
义 元 素 的 部 分 (属性 )， 我 们 需要 使 用 点 运算 
符 。 换 言 之 ， 首 先 定义 元 素 ， 然 后 才能 定义 CE 






元 素 的 部 分 。 因 此 ， 第 3 个 学 生 的 标识 被 定 图 11-8 记录 数组 


(student [3]).id 


注意 我 们 使 用 了 括号 来 强调 首先 这 个 特别 的 学 生 要 被 选择 ， 然 后 才 是 这 个 学 生 的 标识 。 
换言之 ， 括 号 告诉 我 们 索引 运算 符 要 先 于 点 运算 符 。 在 某 些 语言 中 ， 这 里 是 不 需要 括号 的 ， 
因为 这 种 优先 已 经 在 语言 本 身 中 建立 了 。 但 使 用 括号 能 总 是 保证 这 样 的 优先 。 

例 11.6 下 面 显示 了 我 们 是 如 何 访问 学 生 数组 中 的 每 个 记录 域 ， 并 在 其 中 存 人 值 的 。 


(student [1]) .id* 一 1001 (student [1]) .name + 一 "可 .ArOony" (student [1]) .grade 'A' 
(student [2]) .id 一 2007 (student2]) .name * 一 "FE.Bushy" (student [2] ) .grade  'F' 


(student [30]) .id 一 3012 (student [30] ) .name < "M.Blair" (student [30]) .grade 一 'B' 
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例 11.7 但 是 , 我 们 通常 是 使 用 循环 来 读 记 录 数 组 中 的 数据 的 。 算 法 11.2 显示 了 这 个 
过 程 的 部 分 伪 代 码 。 


算法 11.2 ” 读 学 生 记 录 的 部 分 伪 代 码 

i 1 
while ( i< 31) 
{ 

read(student [i]).id 

read(student [i]).name 

read(student [i]) .grade 

hi 灿 


} 


11.2.4 ”数组 与 记录 数组 


数组 和 记录 数组 都 表示 数据 项 的 列表 。 数 组 可 以 被 看 成 是 记录 数组 的 一 种 特例 ， 其 中 每 
个 元 素 是 只 带 一 个 域 的 记录 。 


11.3 ”链表 


链表 是 一 个 数据 的 集合 ， 其 中 每 个 元 素 包 含 下 一 个 元 素 的 地 址 ; 即 每 个 元 素 包含 两 部 分 : 
数据 和 链 。 数 据 部 分 包含 可 用 的 信息 ， 并 被 处 理 。 链 则 将 数据 连 在 一 起 ， 它 包含 一 个 指明 列 
表 中 下 一 个 元 素 的 指针 (地址 )。 另 外 ， 一 个 指针 变量 标识 该 列表 中 的 第 一 个 元 素 。 列 表 的 
名 字 就 是 该 指针 变量 的 名 字 。 

图 11-9 显示 了 一 个 称 为 scores 的 链表 ， 它 含有 4 个 元 素 。 除 最 后 一 个 元 素 外 ， 其 他 每 
个 元 素 的 链接 指向 它 的 后 继 节点 。 链 表 中 最 后 一 个 元 素 包含 一 个 空 指针 ， 表 示 链 表 的 结束 。 
我 们 把 头 指针 为 空 的 链表 定义 为 空 链表 。 图 11-9 显示 一 个 空 链表 的 例子 。 






一 个 链表 ES 
scores 数据 链 


一 个 空 链表 图 一 个 节点 攻 


scores 


图 11-9 链表 


链表 中 的 元 素 习惯 上 称 为 节点 ， 链 表 中 的 节点 是 至 少 包括 两 个 域 的 记录 : 一 个 包含 数 
据 ， 另 一 个 包含 链表 中 下 一 个 节点 的 地 址 (链接 )。 图 11-9 也 显示 了 节点 。 

在 对 链表 进行 进一步 讨论 前 ， 我 们 需要 解释 一 个 在 图 11-9 中 的 记号 。 使 用 连 线 显示 两 
个 节点 间 的 连接 。 线 的 一 端 有 一 箭头 ， 线 的 另 一 端 是 一 实心 圆 。 箭 头 表 示 箭 头 所 指 节点 的 地 
址 副本 。 实 心 圆 显示 了 地 址 的 副本 存储 的 地 方 〈 图 11-10 )。 图 11-10 中 还 显示 了 我 们 可 以 把 
地 址 的 副本 存在 多 于 一 个 的 位 置 。 例 如 ， 图 11-10 显示 了 两 个 地 址 副本 被 存储 在 两 个 不 同位 
置 。 理 解 这 些 概念 有 助 于 我 们 更 好 地 理解 链表 上 的 操作 。 


11.3.1 ”数组 与 链表 


数组 和 链表 都 能 表示 内 存 中 的 数据 项 列表 。 唯 一 的 区 别 在 于 数据 项 连接 在 一 起 的 方式 。 
在 记录 数组 中 ， 连 接 工具 是 索引 。 元 素 scores[3] 与 元 素 scores[4] 相连 ， 因 为 整数 4 是 紧 跟 
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在 整数 3 后 面 的 。 在 链表 中 ， 连 接 工具 是 指向 下 一 元 素 的 链 (指针 或 下 一 元 素 的 地 址 )。 
图 11-11 比较 了 5 个 整数 列表 的 两 种 表示 。 


节点 地 址 的 第 一 个 








一 个 副本 地 址 副本 

第 一 个 副本 存在 这 里 … 国 | 

第 二 个 副本 存在 这 里 一 国 | 
存在 这 里 


图 11-10 副本 和 存储 指针 的 概念 


scores 


scores 
scores [1][ 66 | 
Scores [2] 
scores [3] 
scores [4]| 85 | 
scores [5]| 96 | 


a) 数组 表示 “b) 链表 
图 11-11 数组 与 链表 


数组 的 元 素 在 内 存 中 是 一 个 接 一 个 中 间 无 间隔 存储 的 ， 即 列表 是 连续 的 。 而 链表 中 的 节 
点 的 存储 中 间 是 有 间隔 的 : 节点 的 链 部 分 把 数据 项 “ 胶 ” 在 一 起 。 换 言 之 ， 计 算 机 可 以 选择 
连续 存储 它们 或 把 节点 分 布 在 整个 内 存 中 。 这 样 有 一 个 优点 : 在 链表 中 进行 的 插入 和 删除 操 
作 更 容易 些 ， 只 需 改 变 指 向 下 一 元 素 地 址 的 指针 。 但 是 ， 这 带 来 了 额外 的 开销 : 链表 的 每 个 
节点 有 一 个 额外 的 域 ， 存 放 内 存 中 下 一 节点 的 地 址 。 


11.3.2 ”链表 名 与 节点 名 


就 像 数 组 与 记录 一 样 ， 我 们 需要 区 分 链表 名 和 节点 名 (链表 中 的 元 素 )。 一 个 链表 必须 
要 有 一 个 名 字 。 

链表 名 是 头 指针 的 名 字 ， 该 头 指针 指向 表 中 第 一 个 节点 。 另 一 方面 ， 节 点 在 链表 中 并 没 
有 明显 的 名 字 ， 有 的 只 是 隐 含 的 名 字 。 节 点 的 名 字 与 指向 节点 的 指针 有 关 。 不 同 的 语言 在 处 
理 指针 与 指针 所 指 节点 间 的 关系 时 是 不 同 的 。 我 们 使 用 在 C 语言 中 使 用 的 约定 。 例 如 ， 如 
果 指 向 节点 的 指针 称 为 p， 我 们 称 节点 为 *p。 因 为 节点 是 一 记录 ， 我 们 能 使 用 节点 的 名 字 来 
存 取 节 点 中 的 域 。 例 如 ， 指 针 p 所 指 节点 的 数据 部 分 和 链 部 分 分 别 为 (*p).data 和 (*p).link。 
这 种 命名 约定 隐 含 着 一 个 节点 可 以 有 多 于 一 个 的 名 字 。 图 11-12 显示 了 链表 名 和 节点 名 。 


(scur).link 





让 SCOTES 率 CUT 
scores 





Sooo 下 


Re 


图 11-12 ”链表 名 与 节点 名 
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11.3.3 ”链表 操作 


我 们 为 数组 定义 的 操作 同样 可 以 应 用 于 链表 。 

1. 查找 链表 

链表 的 查找 算法 只 能 是 顺序 的 (参见 第 8 章 )， 因 为 链表 中 的 节点 没有 特定 的 名 字 (不 像 
数组 中 的 元 素 )， 这 个 名 字 可 以 通过 折 半 查找 找到 。 但 是 ， 既 然 链表 中 的 节点 没有 名 字 ， 那 
我 们 使 用 两 个 指针 : pre (先前 的 ) 和 cur (当前 的 )。 

在 查找 开始 时 ，pre 指针 为 空 ，cur 指针 指向 第 一 个 节点 。 查 找 算 法 向 表 的 尾部 方向 移 
动 两 个 指针 。 图 11-13 显示 了 在 极端 情况 下 这 两 个 指针 在 表 中 的 移动 ， 这 种 极端 情况 是 : 目 
标 值 比 表 中 任何 值 都 大 。 例 如 ， 在 5 个 节点 的 表 中 ， 假 定 目标 值 是 220， 它 比 表 中 任何 值 
都 大 。 


表 [102 | 





图 11-13 查找 链表 时 pre 和 cur 指针 的 移动 


但 是 ， 可 能 发 生 其 他 情况 ， 如 目标 值 可 能 会 比 第 一 节点 中 的 数据 值 小 ， 或 者 等 于 某 个 节 
点 中 的 数据 值 等 。 但 是 ， 在 所 有 情况 下 ， 当 查找 结束 时 ，cnur 指针 指向 停止 查找 的 节点 ，pre 
指针 指向 先前 的 节点 。 如 果 目 标 被 找到 ，cur 指针 指向 含有 目标 值 的 节点 ; 如 果 目 标 未 找到 ， 
cur 指针 指向 一 个 值 大 于 目标 值 的 节点 。 换 言 之 ， 既 然 表 是 有 序 的 ， 可 能 很 长 ， 所 以 如 果 我 们 
坚信 传递 了 目标 值 ， 那 我 们 永远 不 允许 两 个 指针 达到 表 的 末端 。 查 找 算 法 使 用 一 个 标记 (一 个 
只 能 取 真 值 或 假 值 的 变量 )。 当 目标 被 找到 时 ， 标 记 设 为 真 ; 当 目标 未 找到 时 ， 标 记 设 为 假 。 
当 标 记 为 真 时 ，cur 指针 指向 目标 值 ; 当 标记 为 假 时 ，cnur 指针 指向 比 目 标 值 大 的 值 。 

图 11-14 显示 了 一 些 不 同 的 情况 。 在 第 一 种 情况 中 ,目标 是 98。 这 个 值 在 表 中 不 存在 ， 
而 且 比 表 中 任何 值 都 小 。 所 以 当 pre 是 空 ，cur 指向 第 一 个 节点 时 ， 算 法 就 停止 了 。 因 为 值 
未 找到 ， 所 以 标记 的 值 为 假 。 在 第 二 种 情况 中 ， 目 标 是 132， 它 是 第 二 个 节点 的 值 。 当 cur 
指针 指向 第 二 个 节点 ，pre 指针 指向 第 一 个 节点 时 ， 算 法 停止 了 。 因 为 目标 被 找到 ， 所 以 标 
记 的 值 为 真 。 在 第 三 种 和 第 四 种 情况 中 ， 目 标 都 没有 找到 ， 所 以 标记 的 值 为 假 。 

算法 11.3 显示 了 查找 的 简化 算法 。 我 们 在 while 循环 中 需要 更 多 的 条 件 ， 但 我 们 把 这 
些 留 给 了 链表 更 高 级 的 讨论 。 注 意 我 们 是 如 何 向 前 移动 两 个 指针 的 。 在 每 一 步 移 动 中 ， 我 
们 有 : 


Pre 人 一 cur 和 cur 二 (*cur) .1ink 
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i 


下 ， 





图 11-14 不 同情 况 下 的 pre 和 cur 指针 的 值 


这 保证 了 两 个 指针 一 起 移动 。 第 一 个 赋值 形成 cur 的 副本 ， 并 把 它 保存 在 pre 中 ， 这 意 
味 着 pre 取 的 是 cur 的 先前 的 值 。 在 第 二 个 赋值 中 ，cur 所 指 的 节点 被 选择 ， 它 的 链 域 的 值 
被 复制 ， 存 储 在 cur 中 (参见 图 11-12 )。 查 找 算法 被 插入 算法 (如果 目 标 未 找到 ) 和 删除 算 
法 (如果 目 标 找到 ) 使 用 。 


算法 : 
目的 : 
前 提 : 
后 续 : 
返回 : 


{ 


算法 11.3 ”查找 链表 


SearchLinkedList 

使 用 两 个 指针 pre 和 cur 查找 链表 
链表 ( 头 指针 ) 和 目标 值 

无 


pre 和 cur 指针 的 位 置 和 标记 的 值 


pre null 


ewr <= Lst 


while (target < (*cur) .data) 


pre 全 cur 
Cur © (*cur) .link 


if ((*cur) .data = target) flag 全 true 


else flag false 
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2. 插 人 节点 
在 插入 链表 之 前 ， 我 们 首先 要 使 用 查找 算法 。 如 果 查 找 算法 的 返回 值 为 假 ， 将 允许 插 


入 ; 否则 终止 插入 算法 ， 因 为 我 们 不 允许 重复 值 的 数据 。 可 能 会 发 生 以 下 4 种 情况 : 
e 在 空 表 中 插入 。 
e 在 表 的 开始 处 插入 。 
e 在 表 的 末尾 插入 。 
e 在 表 中 间 插 入 。 
(1 ) 插入 空 表 
如 果 表 是 空 (list=null)， 新 数据 项 被 作为 第 一 个 元 素 播 入。 一 条 语句 能 做 这 工作 : 


list < new 


(2 ) 开始 处 插入 


如 果 查 找 算法 返回 的 标记 为 假 ，pre 指针 的 值 为 空 ， 那 数据 就 需要 插 在 表 的 开始 处 。 需 
要 两 条 语句 来 做 这 工作 : 
(*new) .link €- cur 和 list 二 new 


第 一 条 赋值 语句 使 得 新 节点 成 为 原先 第 一 节点 的 前 驱 。 第 二 条 语句 使 得 新 连接 的 节点 成 
为 第 一 个 节点 。 图 11-15 显示 了 这 种 情况 。 


cur <— (*new).link list <— new 











图 11-15 在 链表 开始 处 插入 节点 


(3 ) 末尾 处 插入 

如 果 查 找 算法 返回 的 标记 为 假 ，cur 指针 的 值 为 空 ， 那 数据 就 需要 插 在 表 的 末尾 。 需 要 
两 条 语句 来 做 这 工作 : 

(*pre) .link 全 new 和 

第 一 条 赋值 语句 把 新 节点 与 原先 最 末节 点 连接 在 一 起 。 第 二 条 语句 把 新 连接 的 节点 变 成 
最 末节 点 。 图 11-16 显示 了 这 种 情况 。 

(4 ) 中 间 插 入 

如 果 查 找 算法 返回 的 标记 值 为 假 ， 两 个 指针 都 不 为 空 ， 那 新 数据 就 需要 插 在 表 的 中 间 。 
需要 两 条 语句 来 做 这 工作 : 


(*new) .link <- cur 和 


(*new) .link © null 


(*pre) .link < new 
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(*pre).link<— new (*new).link <— null 





图 11-16 在 链表 末尾 处 插入 节点 


第 一 条 赋值 语句 把 新 节点 与 它 的 后 继 连接 在 一 起 。 第 二 条 语句 把 新 节点 与 它 的 前 驱 连 接 
在 一 起 。 图 11-17 显示 了 这 种 情况 。 
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图 11-17 在 链表 中 间 插 和 人 节点 
算法 11.4 显示 了 在 链表 中 插入 一 个 新 节点 的 伪 代 码 。 其 中 第 一 段 是 给 一 空 表 揪 人 节点 。 
算法 11.4 ”在 链表 中 插入 节点 


算法 : InsertLinkedList (list,target,new) 
目的 : 在 查找 链表 找到 合适 位 置 后 ， 在 链表 中 插入 节点 
前 提 : 链表 和 要 插入 的 目标 数据 
后 续 : 无 
返回 : 新 链表 
{ 
searchlinkedlist(list, target, pre, cur, flag) 
// Given target and returning pre, cur, and flag 
if (flag = true) // No duplicate 
于 
return list 
} 
if (list = null) // Insertion empty list 
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list 人 二 new 
} 
if (pre = null) // Insertion at the beginning 
{ 
(*new) .link 一 cur 
list < new 
return list 
} 
if (cur = null) // Insertion at the end 
{ 
(*pre) .link © new 
(*new) .link 一 null 
return list 
} 
(*new) .link 人 一 cur // Insertion in the middle 
(*pre) .link © new 
return list 


} 


3. 删除 节点 

在 链表 中 删除 节点 之 前 ， 我 们 要 先 应 用 查找 算法 。 如 果 查 找 算法 返回 的 标记 是 真 (节点 
找到 )， 我 们 可 以 从 链表 中 删除 该 节点 。 但 是 ， 删 除 操作 比 插入 操作 简单 些 ， 因 为 我 们 只 要 
两 种 情况 : 删除 首 节点 和 删除 其 他 任何 节点 。 换 言 之 ， 删 除 末 节点 和 删除 中 间 节 点 可 以 由 同 
一 过 程 完成 。 

(1 ) 删除 首 节点 

如 果 pre 指针 为 空 ， 首 节点 将 被 删除 。cur 指针 指向 首 节点 ， 删 除 由 一 条 语句 完成 : 


list 人 * (*cur) .Link 


该 语句 把 第 二 个 节点 与 表 指 针 连 接 在 一 起 ， 这 意味 着 首 节点 被 删除 。 图 11-18 显示 了 这 
种 情况 。 


list 4 一 (*cur).link 





图 11-18 删除 链表 中 的 首 节点 


(2 ) 删除 中 间或 未 尾 节点 
如 果 两 个 指针 都 不 为 空 ， 那 要 删除 的 节点 或 者 是 中 间 节 点 ， 或 者 是 末尾 节点 。cur 指针 
指向 相应 的 节点 ， 可 以 通过 一 条 语句 完成 删除 : 


(*pre) .link < (*cur) .1ink 


该 语句 把 后 继 节点 与 前 驱 节点 连接 在 一 起 ， 这 意味 着 当前 节点 被 删除 。 图 11-19 显示 了 
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这 种 情况 。 


查找 后 (*pre).link (*cur).link 

















图 11-19 ”在 链表 中 间或 末尾 删除 节点 


算法 11.5 显示 了 删除 节点 的 伪 代 码 。 算 法 比 插入 一 条 语句 要 简单 ， 我 们 只 要 两 种 情况 ， 
每 种 情况 只 需 一 条 语句 。 


算法 11.5 ”在 链表 中 删除 节点 
算法 : DeleteLinkedList (list,target) 
目的 : 在 查找 链表 找到 正确 节点 后 ， 在 链表 中 删除 节点 
前 提 : 链表 和 要 删除 的 目标 数据 
后 续 : 无 
返回 : 新 链表 
{ 
// Given target and returning pre, cur, and flag 
searchlinkedlist(list, target, pre, cur, flag) 
if (flag = false) 
{ 
return list // The node to be deleted not found 
} 
if (pre = null) // Deleting the first node 
{ 
ligt = (veourys 1any 
return list 
} 
(*pre) .link < (*cur) .link // Deleting other nodes 
return list 


} 


4. 检索 节点 

检索 就 是 为 了 检查 或 复制 节点 中 所 含 数据 的 目的 而 随机 访问 节点 。 在 检索 之 前 ， 链 表 需 
要 被 查找 。 如 果 找 到 数据 ， 那 它 被 检索 ， 否 则 过 程 终止 。 检 索 只 使 用 cur 指针 ， 它 指向 被 查 
找 算法 找到 的 节点 。 算 法 11.6 显示 了 检索 节点 中 的 数据 的 伪 代 码 。 该 算法 比 插入 和 删除 算 
法 简单 得 多 。 


算法 11.6 ”在 链表 中 检索 节点 
算法 : RetrieveLinkedList (list,target) 
目的 : 在 查找 链表 找到 正确 节点 后 ， 在 节点 中 检索 数据 
前 提 : 链表 ( 头 指针 ) 和 要 检索 的 目标 数据 
后 续 : 无 
返回 : 返回 检索 到 的 数据 
{ 
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searchlinkedlist(list, target, pre, cur, flag) 
if (flag = false) // The node not found 
{ 
return error 
} 
return (*cur) .data 


} 


5. 遍历 链表 

为 了 遍历 链表 ,我们 需要 一 个 “步行 ”指针 ， 当 元 素 被 处 理 时 ， 它 从 一 个 节点 移 到 另 一 
个 节点 。 开 始 遍 历时 ， 我 们 把 步行 指针 指向 表 
链表 中 的 首 节 点 ， 然 后 使 用 循环 ， 直 到 所 有 
数据 都 被 处 理 。 每 次 循环 处 理 当前 节点 , 然 。 
后 把 步行 指针 指向 下 一 个 节点 。 当 最 后 一 个 “ 国 一 0 
节点 被 处 理 完 时 ， 步 行 指针 变 为 空 ， 循 环 终 “， 
止 (图 11-20 )。 

算法 11.7 显示 了 遍历 链表 的 伪 代 码 。 


算法 11.7 ”遍历 链表 


图 11-20 遍历 链表 


算法 : TraverseLinkedList (List) 
目的 : 遍历 链表 ， 处 理 每 个 数据 项 
前 提 : 链表 ( 头 指针 ) 
后 续 : 无 
返回 : 表 
{ 
walker < list 
while (walker x null) 
{ 
Process (*walker) .data 
walker © (*walker) .link 
} 
return list 


} 


11.3.4 ”链表 的 应 用 


当 和 需要 对 存储 数据 进行 许多 插入 和 删除 时 ， 链 表 是 一 种 非常 高 效 的 数据 结构 。 链 表 是 一 
种 动态 的 数据 结构 ， 其 中 表 从 没有 节点 开始 ， 然 后 当 需 要 新 节点 时 ， 它 就 逐渐 增长 。 与 数组 
的 情况 相 比 ， 节 点 很 容易 被 删除 ， 不 需要 移动 其 他 节点 。 例 如 ， 链 表 可 以 应 用 于 包含 学 校 学 
生 的 记录 。 每 季 或 每 学 期 ， 新 生 进 和 学校， 而 有 些 学 生 离 开学 校 或 毕业 。 

链表 可 以 无 限 增长 ， 也 可 以 缩短 为 空 表 。 额 外 的 开销 是 为 每 个 节点 含有 一 个 额外 的 域 。 
但 是 对 于 需要 经 常 查找 的 数据 来 说 ， 链 表 不 是 一 个 好 的 候选 者 。 这 就 陷 人 了 进退 两 难 的 境 
地 ， 因 为 每 个 删除 或 插入 操作 都 需要 查找 。 在 下 一 章 中 ， 我 们 可 以 看 到 一 些 抽象 数据 类 型 ， 
它们 既 有 数组 对 点 ， 也 有 链 的 优点 。 


i 
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11.4 ” 章 末 材料 
推荐 读物 

有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书 籍 : 

e Gilberg, R. and Forouzan, B. Data Structure - A Pseudocode Approach with C, Boston, 
MA: Course Technology, 2006 
Goodrich, M. and Tamassia, R. Data Structure and Algorithm in Java, New York: Wiley, 
2005 
Neapolitan, R. and Naimipour, K. Foundations of Algorithm Using C++ Pseudocode, 
Sudbury, MA: Jones and Bartlett, 2004 
Main, M. and Savitch, W. Data Structure and Other Objects Using C++, Reading, MA: 
Addison Wesley, 2004 
Standish, T. Data Structures, Algorithm, and Software Principles, Reading, MA:Addison 
Wesley, 1994 


小 结 


数据 结构 使 用 相关 变量 的 集合 ， 这 些 变 量 可 以 被 单独 存 取 或 被 整体 存 取 。 换 言 之 ， 

数据 结构 表示 一 组 共享 指定 关系 的 数据 项 。 在 本 章 中 ,我们 讨论 了 三 种 数据 结构 : 

数组 、 记 录 和 链表 。 

数组 是 通常 具有 相同 类 型 的 元 素 的 顺序 集合 。 使 用 索引 访问 数组 中 的 元 素 。 在 数组 
中 ， 有 两 种 不 同类 型 的 标识 符 : 数组 的 名 字 和 每 个 元 素 的 名 字 。 

许多 应 用 需要 数据 以 多 于 一 维 的 形式 存储 。 一 个 常见 的 例子 是 表 ， 它 是 由 行 和 列 构 

成 的 数组 。 二 维 数组 在 内 存 中 可 以 使 用 行 主 序 存储 或 列 主 序 存储 ， 第 一 种 更 为 常见 。 

e 作为 一 种 结构 的 数组 上 的 常见 操作 有 : 查找、 插入、 删除、 检索 和 遍历 。 当 删除 和 
插入 的 量 较 小 ， 而 需要 大 量 的 查找 和 检索 时 ， 数 组 是 一 种 合适 的 结构 。 数 组 通常 是 
一 种 静态 数据 结构 ， 所 以 当 数 据 项 的 数目 固定 时 ， 数 组 就 更 为 合适 。 

e 记录 是 一 个 相关 元 素 的 集合 ， 这 些 元 素 可 能 是 不 同 的 类 型 ， 但 整个 记录 有 一 个 名 称 。 
记录 中 的 每 个 元 素 称 为 一 个 域 。 域 是 记录 中 有 意义 的 命名 数据 的 最 小 元 素 。 

e 链表 是 一 个 有 序数 据 的 集合 ， 其 中 每 个 元 素 包含 下 一 个 元 素 的 位 置 (地 址 ) 。 每 个 元 

素 包 含 两 个 部 分 : 数据 和 链 。 数 据 部 分 含有 有 用 的 信息 : 要 处 理 的 数据 。 链 用 于 将 

数据 链 在 一 起 。 

为 数组 定义 的 操作 都 可 以 应 用 于 链表 。 当 数据 将 要 进行 大 量 的 插 人 和 删除 时 ， 链 表 

是 非常 高 效 的 结构 。 链 表 是 一 种 动态 的 数据 结构 ， 其 中 表 可 以 从 无 节点 开始 ， 当 需 

要 新 的 节点 时 ， 表 逐渐 增长 。 


11.5 练习 
小 测验 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 继续 本 章 习 题 前 首先 
完成 相关 测验 以 检测 对 本 材料 的 理解 。 
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复习 题 


1. 给 出 数据 结构 的 三 种 类 型 名 称 。 

2. 数组 元 素 和 记录 元 素 的 区 别 是 什么 ? 

3. 数组 元 素 和 链表 元 素 的 区 别 是 什么 ? 

4. 为 什么 用 索引 而 不 是 下 标 来 标注 数组 元 素 ? 
5. 数组 元 素 在 内 存 中 如 何 存储 ? 

6. 记录 中 域 的 定义 是 什么 ? 

7. 在 链表 中 节点 的 域 是 什么 ? 

8. 链表 中 指针 的 功能 是 什么 ? 

9. 如 何 指向 链表 中 的 第 一 个 节点 ? 

10. 链表 中 最 后 一 个 节点 的 指针 指向 什么 ? 





练习 题 

1. 两 个 数组 A 和 B， 各 有 10 个 整数 ， 要 求 测试 数组 A 中 每 个 元 素 是 否 与 数组 B 中 对 应 元 素 相等 ， 写 
出 该 算法 。 

2. 写 出 一 个 算法 ， 要 求 倒序 排列 数组 中 元 素 ， 即 最 后 一 个 变 成 第 一 个 ， 倒 数 第 二 个 成 为 第 二 个 ， 以 此 
类 推 。 


3. 写 出 一 个 算法 ， 要 求 打 印 出 具有 及 行 和 C 列 的 二 维 数组 中 的 内 容 。 

4. 写 出 一 个 算法 ， 在 具有 N 个 元 素 的 数组 上 应 用 顺序 查找 。 

5. 写 出 一 个 算法 ， 在 具有 N 个 元 素 的 数组 上 应 用 折 半 查找 。 

6. 写 出 一 个 算法 ， 在 有 序 的 数组 中 插入 一 个 元 素 ， 算 法 必须 调用 查找 算法 找到 插 人 的 位 置 。 
7. 写 出 一 个 算法 ， 在 有 序 的 数组 中 删除 一 个 元 素 ， 算 法 必须 调用 查找 算法 找到 插 人 的 位 置 。 
8. 写 出 一 个 算法 ， 给 数组 中 的 每 个 元 素 乘 以 一 个 常数 。 

9. 写 出 一 个 算法 ， 要 求 将 一 分 数 (Frl ) 加 到 另 一 分 数 (Fr2 ) 上 。 

10. 写 出 一 个 算法 ， 要 求 从 一 分 数 (Fr2 ) 中 减 去 另 一 分 数 (Frl ) 。 

11. 写 出 一 个 算法 ， 要 求 一 分 数 (Frl ) 乘 以 另 一 分 数 (Fr2 ) 。 

12. 写 出 一 个 算法 ， 要 求 用 分 数 (Fr2 ) 除 分 数 (Frl ) 。 

13. 画 出 一 个 示意 图 ， 显 示 数 据 部 分 是 学 生 记录 的 链表 ， 记 录 中 有 标识 、 姓 名 和 成 绩 。 

14. 显示 链表 的 删除 算法 (算法 11.4 ) 是 如 何 删除 链表 中 唯一 的 一 个 节点 的 。 

15. 显示 链表 的 插入 算法 (算法 11.3 ) 是 如 何在 空 链 表 中 插入 一 个 节点 的 。 

16. 显示 我 们 如 何 使 用 插入 算法 (算法 11.3 ) 从 零 开 始 建立 一 链表 。 

17. 写 一 个 算法 ， 求 出 数字 链表 中 数字 的 平均 数 。 

18. 如 果 我 们 对 图 11-9 的 链表 应 用 下 列 语 句 ， 将 会 发 生 什么 ? 


scores 人 +  (*SCoreSs) .link 
19. 如 果 我 们 对 图 11-13 的 链表 应 用 下 列 语 句 ， 将 会 发 生 什么 ? 
EUE 《4 (“eur) .ink 和 pre + (*Pre) .link 
小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨论 材料 的 理解 。 
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抽象 数据 类 型 





在 这 一 章 中 ， 我 们 讨论 抽象 数据 类 型 (ADT)， 这 是 一 种 比 我 们 在 第 11 章 所 讨论 的 数据 
结构 处 于 更 高 抽象 层 的 数据 类 型 。ADT 使 用 数据 结构 来 实现 。 在 本 章 的 开始 首先 对 抽象 数 
据 类 型 做 一 个 简短 的 背景 介绍 ， 然 后 给 出 定义 并 提出 模型 。 接 着 讨论 各 种 不 同 的 抽象 数据 类 
型 ， 例 如 ， 栈 、 队 列 、 广 义 线性 列表 、 树 、 二 叉 树 、 二 叉 搜 索 树 和 图 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

e 说 明 抽象 数据 类 型 (ADT) 的 概念 ; 

e 说 明 栈 、 栈 上 的 基本 操作 、 它 们 的 应 用 和 它们 是 如 何 实现 的 ; 

e 说 明 队 列 、 队 列 上 的 基本 操作 、 它 们 的 应 用 和 它们 是 如 何 实现 的 ; 

e 说 明 广 义 线性 表 、 广 义 线性 表 上 的 基本 操作 、 它 们 的 应 用 和 它们 是 如 何 实现 的 ; 

e 说 明 一 般 的 树 和 它 的 应 用 ; 

e 说 明 二 叉 树 (一 种 特殊 的 树 ) 和 它 的 应 用 ; 

e 说 明 二 又 搜索 树 (BST) 和 它 的 应 用 ; 

e 说 明 图 和 它 的 应 用 。 


12.1 背景 


使 用 计算 机 进行 问题 求解 意味 着 处 理 数 据 。 为 了 处 理 数 据 ， 我 们 需要 定义 数据 类 型 和 
在 数据 上 进行 的 操作 。 例 如 ， 要 求 一 个 列表 中 的 数字 之 和 ,我们 应 该 选择 数字 的 类 型 ( 整 
数 或 实数 ) 和 定义 运算 (加 法 )。 数 据 类 型 的 定义 和 应 用 于 数据 的 操作 定义 是 抽象 数据 类 型 
(ADT) 背后 的 一 部 分 概念 ， 隐 藏 数据 上 的 操作 是 如 何 进行 的 。 换 言 之 ，ADT 的 用 户 只 需要 
知道 对 数据 类 型 可 用 的 一 组 操作 ， 而 不 需要 知道 它们 是 如 何 应 用 的 。 


12.1.1 简单 抽象 数据 类 型 


许多 编程 语言 已 经 定义 了 一 些 简单 的 抽象 数据 类 型 作为 语言 的 整数 部 分 。 例 如 ，C 语言 
定义 了 称 为 整数 的 简单 抽象 数据 类 型 。 这 种 类 型 的 抽象 数据 类 型 是 带 有 预先 定义 范围 的 整 
数 。C 还 定义 了 可 以 在 这 种 数据 类 型 上 应 用 的 几 种 操作 (加 、 减 、 乘 、 除 等 )。C 显 式 地 定 
义 了 整数 上 的 这 些 操作 和 我 们 期 望 的 结果 。 写 C 程序 来 进行 两 整数 相 加 ， 程 序 员 应 该 知道 
整数 的 抽象 数据 类 型 和 可 以 应 用 于 该 抽象 数据 类 型 的 操作 。 

但 是 ， 程 序 员 不 需要 知道 这 些 操 作 是 如 何 实现 的 。 例 如 ， 程 序 员 使 用 表达 式 > 二 x+y， 
希望 x 的 值 (整数 ) 被 加 到 y 的 值 (整数 ) 上 。 结 果 被 命名 为 z (整数 )。 程 序 员 不 需要 知道 
加 法 是 如 何 进行 的 。 在 前 一 章 我 们 学 到 计算 机 是 如 何 执 行 加 法 运算 的 : 把 两 个 整数 以 补 的 格 
式 存 储 在 内 存 地 址 中 ， 把 它们 装 入 CPU 的 寄存 器 中 ， 进 行 二 进 制 相 加 ， 把 结果 回 存 到 另 一 
个 内 存 地 址 中 。 但 是 ,程序 员 不 必 知 道 这 些 。C 语言 中 的 整数 就 是 一 个 带 有 预定 义 操作 的 简 
单 抽象 数据 类 型 。 程 序 员 不 必 关 注 操 作 是 如 何 进行 的 。 
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12.1.2 ”复杂 抽象 数据 类 型 


几 种 简单 的 抽象 数据 类 型 (如 整数 、 实 数 、 字 符 、 指 针 等 ) 已 经 被 实现 ， 在 大 多 数 语言 
中 它们 对 用 户 是 可 用 的 。 但 是 许多 有 用 的 复杂 抽象 数据 类 型 却 没 有 实现 。 就 像 我 们 在 这 一 章 
中 将 要 看 到 的 ， 我 们 需要 表 抽 象 数据 类 型 、 栈 抽象 数据 类 型 、 队 列 抽象 数据 类 型 等 。 要 提高 
效率 ， 应 该 建立 这 些 抽象 数据 类 型 ， 将 它们 存储 在 计算 机 库 中 ， 以 便 使 用 。 例 如 ， 表 的 使 用 
者 只 需要 知道 该 表 上 有 哪些 可 用 的 操作 ， 而 不 需 知道 这 些 操 作 是 如 何 进行 的 。 
因此 ， 对 于 一 个 ADT， 用 户 不 用 关心 任务 是 如 何 完成 的 ， 而 是 关心 能 做 什么 。 换 言 之 ， 
ADT 包含 了 一 组 允许 程序 员 使 用 的 操作 的 定义 ， 而 这 些 操作 的 实现 是 隐藏 的 。 这 种 不 需 详 
细 说 明 实 现 过 程 的 泛 化 操作 称 为 抽象 。 我 们 抽取 了 过 程 的 本 质 ， 而 隐藏 了 实现 的 细节 。 
抽象 概念 意味 着 : 
1. 知道 一 个 数据 类 型 能 做 什么 。 
2. 如 何 去 做 是 隐藏 的 。 


12.1.3 ”定义 


让 我 们 正式 地 定义 抽象 数据 类 型 。 抽 象 数 据 类 型 就 是 与 对 该 数据 类 型 有 意义 的 操作 封装 
在 一 起 的 数据 类 型 。 然 后 ， 用 它 封 装 数据 和 操作 并 对 用 户 隐藏 。 
抽象 数据 类 型 : 
1. 数据 的 定义 。 
2. 操作 的 定义 。 
3. 封装 数据 和 操作 。 


12.1.4 ”抽象 数据 类 型 的 模型 


抽象 数据 类 型 的 模型 如 图 12-1 所 示 。 图 中 不 规则 轮廓 中 的 浅 阴 影 区 域 部 分 表示 模型 。 
在 这 个 抽象 区 域内 部 是 该 模型 的 两 个 部 分 : 数据 结构 和 操作 (公有 的 和 私有 的 )。 应 用 程序 
只 能 通过 接口 访问 公有 操作 。 接 口 是 公 
有 操作 和 传 给 或 从 这 些 操 作 返 回 的 数据 
的 列表 。 私 有 操作 是 抽象 数据 类 型 内 部 
用 户 使 用 的 。 数 据 结 构 ( 如 数组 、 链 表 ) 
在 抽象 数据 类 型 里 面 ， 被 公有 和 私有 操 
作 使 用 。 

虽然 公有 操作 和 接口 应 该 独立 于 
实现 , 但 私有 操作 依赖 于 抽象 数据 类 型 
实现 时 所 选择 的 数据 结构 。 当 我 们 讨论 
有 些 抽象 数据 类 型 时 ， 将 详细 说 明 这 个 
问题 。 图 12-1 抽象 数据 类 型 的 模型 
12.1.5 ”实现 


计算 机 语言 不 提供 抽象 数据 类 型 包 。 要 使 用 抽象 数据 类 型 ， 首 先 要 实现 它们 ， 把 它们 存 
储 在 库 中 。 本 章 主要 介绍 一 些 常见 的 抽象 数据 类 型 及 其 应 用 。 但 是 ， 我 们 也 为 对 此 有 兴趣 的 
读者 提供 了 每 个 抽象 数据 类 型 实现 的 简单 讨论 。 我 们 把 实现 的 伪 码 算法 作为 挑战 练习 。 





接口 





公有 操作 私有 操作 
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12.2 栈 


栈 是 一 种 限制 线性 列表 ， 该 类 列表 的 添加 和 删除 操作 只 能 在 一 端 实现 ， 称 为 “ 栈 顶 ” 。 
如 果 插 入 一 系列 数据 到 栈 中 ， 然 后 移 走 它们 ， 那 么 数据 的 顺序 将 被 倒转 。 数 据 插入 时 的 顺序 
为 5，10，15，20， 移 走 后 顺序 就 变 成 20，15，10，5。 这 种 倒转 的 属性 也 正 是 栈 被 称 为 后 
进 先 出 (LIFO) 数据 结构 的 原因 。 

人 们 在 日 常生 活 中 使 用 不 同类 型 的 栈 ， 比 如 说 一 堆 硬 币 或 一 堆 书 。 任 何 只 能 在 顶部 添加 
或 移 除 物体 的 情况 都 是 栈 。 如 果 想 移 除 任何 不 是 顶部 的 物体 ， 则 首先 必须 移 除 其 上 面 的 所 有 
物体 。 图 12-2 给 出 了 栈 的 三 个 示例 。 

插入 (入 栈 ) 删除 (出 栈 ) 





书 的 栈 计算 机 的 栈 
图 12-2 ” 栈 的 三 个 示例 


12.2.1 栈 的 操作 


尽管 栈 有 很 多 操作 ， 但 基本 操作 有 4 种: 建 栈 、 入 栈 、 出 栈 和 空 。 本 章 定义 它们 。 
1. 建 栈 
建 栈 操作 创建 一 个 空 栈 ， 格 式 如 下 : 


stack (stackName) 

stackName 是 要 创建 栈 的 名 字 。 这 个 操作 返回 一 个 空 本 一 | 
栈 。 图 12-3 显示 了 这 个 操作 的 图 形 表示 。 

2. 人 栈 图 12-3 We 

入 栈 操作 在 栈 顶 添加 新 的 元 素 ， 格 式 如 下 : 


push (stackName, dataItem) 


stackName 是 栈 的 名 字 ，dataltem 是 要 插 在 栈 顶 的 数据 。 人 栈 后 ， 新 的 元 素 称 为 栈 顶 元 
素 。 这 个 操作 返回 一 个 dataItem 插 在 顶端 的 新 栈 。 图 12-4 显示 了 这 个 操作 的 图 形 表 示 。 


要 人 栈 的 数据 
栈 顶 元 素 ………… 
[20 | 


30 
人 栈 前 人 栈 后 
图 12-4 “入 栈 操作 





3. 出 栈 
出 栈 操作 将 栈 顶 元 素 移 走 ， 格 式 如 下 : 


pop (stackNmaeyvdataItem) 
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stackName 是 栈 的 名 字 ，dataltem 是 从 栈 中 移 走 的 数据 。 图 12-5 显示 了 这 个 操作 的 图 形 
表示 。 
要 人 栈 的 数据 





出 栈 前 出 栈 后 
图 12-5 出 栈 操作 


删除 的 项 可 以 被 应 用 程序 使 用 ， 也 可 以 被 丢弃 。 出 栈 操作 之 后 ， 在 删除 之 前 ， 栈 顶 元 素 
下 面 的 项 就 成 为 栈 顶 元 素 。 这 个 操作 返回 一 个 少 一 个 元 素 的 新 栈 。 

4. 空 

空 操作 检查 栈 的 状态 ， 格 式 如 下 : 


empty (stackName) 


stackName 是 栈 的 名 字 。 如 果 栈 为 空 ， 此 操作 返回 真 ; 如 果 栈 非 空 ， 返 回 假 。 
12.2.2 栈 的 抽象 数据 类 型 


我 们 把 栈 定义 成 如 下 的 抽象 数据 类 型 : 
栈 的 抽象 数据 类 型 
定义 : 一 种 只 能 在 一 端 存 取 的 数据 项 表 ， 该 端 称 为 栈 顶 。 


操作 : stack: 建立 一 个 空 栈 。 
push: 在 栈 顶 揪 入 一 个 元 素 。 
pop: 删除 栈 顶 元 素 。 
empty: 检查 栈 的 状态 。 Stack (CS) 
例 12.1 图 12-6 显 示 了 在 栈 S 上 应 用 | push (s, 10) 
先前 定义 的 操作 的 算法 的 一 个 片段 。 第 4 个 
操作 在 试图 弹出 栈 项 元 素 前 检查 栈 的 状态 ， 
栈 项 元 素 的 值 存储 在 变量 x 中 ,但 是 ,我们 | f(t empty (s)) pop (S, x) 
并 没有 使 用 这 个 值 ， 它 将 在 算法 结束 时 自动 | push (s, 12) 
被 丢弃 。 算法 片段 


12.2.3” 栈 的 应 用 图 12-6 例 12.1 


栈 的 应 用 可 分 为 4 大 类 : 倒转 数据 、 配 对 数据 、 数 据 延 迟 使 用 和 回溯 步骤。 下 面 我 们 讨 
论 前 面 的 两 种 。 

1. 倒转 数据 

倒转 数据 需要 一 组 给 定 的 数据 项 ， 重 新 排序 ， 使 得 首尾 元 素 互 换 ， 中 间 的 所 有 元 素 也 相 
应 地 进行 交换 。 例 如 : 表 (2，4，7，1，6，8 ) 变 成 表 (8，6，1，7，4，2 )。 

例 12.2 在 第 2 章 中 (图 2-6 )， 我 们 给 出 了 一 个 简单 的 UML 图 ， 把 一 个 整数 从 十 进 制 
转换 成 任意 进 制 。 虽 然 算 法 非常 简单 ， 如 果 打 印 它们 创建 的 倒 排 整数 的 数字 ， 我 们 将 得 到 倒 
排 顺序 的 数字 。 任 何 计算 机 语言 中 的 打印 指令 都 是 从 左 到 右 打印 字符 的 ， 但 算法 是 从 右 到 左 


push (s, 12) 
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建立 数字 的 。 我 们 使 用 栈 的 倒转 特性 (LIFO 结构 ) 来 解决 这 个 问题 。 
算法 12.1 显示 了 把 十 进 制 转化 为 二 进 制 和 打印 结果 的 伪 代码。 


算法 12.1 例 12.2 
算法 : DecimalToBinary (number) 
目的 : 打印 所 给 定 的 整数 (绝对 值 ) 等 价 的 二 进 制 数 
前 提 : 给 出 要 转化 的 整数 (数字 ) 
后 续 : 二 进 制 整 数 被 打印 
返回 : 无 


stack (S) 
while (number 0) 
{ 
remainder 全 number mod 2 
push (S, remainder) 
number 人 一 number / 2 
} 
while ( not empty(S)) 
{ 
pop (S, x) 
print (x) 
} 
return 


} 


现在 先 创建 一 个 空 的 栈 ， 然 后 使 用 while 循环 创建 二 进 制 位 ， 我 们 不 是 打印 出 它们 ， 而 
是 把 它们 入 到 栈 中 。 当 所 有 的 二 进 制 位 都 被 创建 后 ， 退 出 循环 。 现 在 我 们 使 用 另外 一 个 循环 
从 栈 中 弹出 二 进 制 位 ， 并 打印 它们 。 注 意 二 进 制 位 是 按 它们 创建 的 相反 顺序 打印 出 来 的 。 

2. 配对 数据 项 

我 们 经 常 需要 在 表达 式 中 进行 一 些 字符 的 配对 。 例 如 ， 当 用 计算 机 语言 写 一 个 数学 表达 
式 时 ， 我 们 经 常 使 用 括号 来 改变 运算 符 的 优先 级 。 由 于 第 二 个 表达 式 中 的 括号 ， 使 得 下 面 两 
个 表达 式 的 计算 结果 不 同 。 


3Xx6+2 = 20 3X (6+2) = 24 


在 第 一 个 表达 式 中 ， 乘 法 运算 符 的 优先 级 比 加 法 的 要 高 〈 它 被 先 计算 )。 在 第 二 个 表达 
式 中 , 括号 忽略 了 优先 级 ， 因 此 先 计 算 加 法 。 当 输入 一 个 带 有 许多 括号 的 表达 式 时 ， 我 们 经 
忘记 括号 的 配对 。 编 译 程序 的 一 个 作用 就 是 为 我 们 做 这 样 的 检查 。 编 译 器 使 用 栈 来 检查 所 
有 的 开 括 号 都 与 闭 括号 配对 。 
例 12.3 算法 12.2 显示 了 如 何 检查 所 有 开 括 号 是 否 与 闭 括 号 配对 。 


算法 12.2 例 12.3 
算法 : CheckingParentheses (expression) 
目的 : 检查 表达 式 中 括号 的 配对 情况 
前 提 : 给 出 要 检查 的 表达 式 
后 续 : 如 果 有 非 配 对 的 括号 ， 则 给 出 错误 消息 
返回 : 无 


Stack (S) 
while (more character in the expression) 
{ 


Char + next character 
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if (Char='(') 
{ 
push (S,Char) 
} 
else 
{ 
if (Char="')') 
{ 
if (empty (S)) 
{ 
print (unmatched opening parenthesis) 
} 
else 
{ 
pop (S,x) 
} 


} 
} 
if (not empty(S) ) 
{ 
print (a closing parenthesis not matched) 


} 


return 


} 


12.2.4 ” 栈 的 实现 


在 这 一 节 中 ， 我 们 描述 栈 抽象 数据 类 型 实现 的 背后 的 总 体 概念 。 在 抽象 数据 类 型 层次 
上 ， 我 们 使 用 栈 及 其 4 个 操作 (stack、push、pop 和 empty) ; 在 实现 的 层次 上 ， 我 们 需要 选 
择 数 据 结构 来 实现 它们 。 栈 抽象 数据 类 型 可 以 使 用 数组 也 可 以 使 用 链表 来 实现 。 图 12-7 显 
示 了 一 个 有 5 个 数据 项 的 栈 抽象 数据 类 型 的 例子 。 图 中 还 显示 了 我 们 是 如 何 实现 栈 的 。 





一 多 
a) 抽象 数据 类 型 b) 数组 实现 c) 链表 实现 
图 12-7 栈 的 实现 


在 数组 实现 中 ， 我 们 有 带 有 两 个 域 的 记录 。 第 一 个 域 用 来 存储 关于 数组 的 信息 : 我 们 把 
它 当 作 计 数 域 ， 在 任何 时 刻 其 中 显示 的 是 栈 中 数据 项 的 数目 。 第 二 个 域 是 含有 顶 元 素 序号 的 
一 个 整数 。 注 意 数组 是 颠倒 显示 的 ， 这 是 为 了 与 链表 实现 相 匹配 。 

链表 的 实现 是 相似 的 : 有 一 个 有 栈 名 字 的 额外 节点 ， 这 个 节点 也 有 两 个 域 : 一 个 计数 器 
和 一 个 指向 栈 顶 元 素 的 指针 。 

算法 

可 以 用 伪 代码 写 出 每 种 实现 定义 的 4 种 操作 。 在 第 11 章 中 显示 了 处 理 数组 和 链表 的 算 
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法 ， 这 些 算 法 可 以 被 修改 成 栈 中 我 们 需要 的 4 种 算法 : stack、push、pop 和 empty。 这 些 算 
法 甚至 比 第 11 章 中 那些 算法 更 简单 ， 因为 插入 和 删除 只 在 栈 顶 进行 。 我 们 把 这 些 算法 的 编 
写 留 作 练 习 。 


12.3 ”队列 


队列 是 一 种 线性 列表 ， 该 表 中 的 数据 只 能 在 称 为 尾部 的 一 端 插入 ， 并 且 只 能 在 称 之 为 头 
部 的 一 端 删除 。 这 些 限 制 确保 了 数据 在 队列 中 只 能 按照 它们 存 人 的 顺序 被 处 理 。 换 言 之 ， 队 
列 就 是 先进 先 出 (FIFO) 结构 。 

队列 是 日 常生 活 中 常见 的 。 一 队 在 车 站 等 公共 汽车 的 人 就 是 一 个 队列 ， 等 待 电话 接线 员 
回复 的 一 系列 电话 也 是 一 个 队列 ， 等 待 计算 机 处 理 的 一 系列 等 待 任务 也 是 队列 。 

图 12-8 给 出 了 两 个 队列 : 一 个 是 人 的 队列 ， 另 一 个 是 计算 机 队列 。 无 论 是 人 还 是 数据 ， 
都 是 从 尾部 进入 了 队列 ， 并 都 要 等 到 他 ( 它 ) 们 到 达 队 列 头 部 〈 队 首 ) 才能 被 处 理 ， 一 旦 他 
( 它 ) 们 到 了 队列 的 头 部 ， 就 离开 队列 并 接受 服务 。 


国人 


队 首 队 尾 
人 的 队列 计算 机 队列 
12-8 ”队列 的 两 个 代表 





12.3.1 队列 的 操作 


尽管 我 们 可 以 为 队列 定义 许多 操作 ， 但 有 4 个 是 基本 的 : 建 队列 、 入 列 、 出 列 和 空 ， 定 
义 如 下 。 

1. 建 队 列 

建 队 列 建立 一 个 空 队 列 ， 格 式 如 下 : 


queue (queueName) 


queueName 是 建立 的 队列 的 名 字 。 这 个 操作 返回 一 个 空 队 列 。 [ 
图 12-9 显示 了 这 个 操作 的 图 形 化 表示 。 操作 空 队列 
2. 人 列 图 12-9 建 队列 操作 


入 列 操作 在 队列 的 尾部 插入 一 个 数据 项 ， 格 式 如 下 : 
enqueue (queueName, dataItem) 
queueName 是 队列 的 名 字 ，dataltem 是 要 在 队列 尾部 插入 的 数据 。 人 和 人 列 操作 后 ， 新 数据 
项 就 成 了 队列 的 最 后 一 项 。 这 个 操作 返回 一 个 dataltem 插 在 队列 尾部 的 新 队列 。 图 12-10 显 
示 了 这 个 操作 的 图 形 化 表示 。 
要 入 列 的 数据 


队 首 。” 队 尾 





操作 人 列 后 
图 12-10 ”入 列 操作 
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3. 出 列 

出 列 操作 删除 队列 前 端的 数据 项 ， 格 式 如 下 : 

dequeue (queueName， dataltem) 

queueName 是 队列 的 名 字 ，dataltem 是 从 队列 中 删除 的 数据 。 被 删除 的 数据 项 可 以 被 应 
用 程序 使 用 ， 也 可 以 被 直接 丢弃 。 出 列 操作 后 ， 紧 跟 在 队 首 的 数据 项 就 成 了 队 首 元 素 。 这 个 
操作 返回 少 一 个 元 素 的 新 队列 。 图 12-11 显示 了 这 个 操作 的 图 形 化 表示 。 


要 出 列 的 数据 
队 首 队 尾 机 队 首 。 队 尾 





7 出 列 
操作 
图 12-11 出 列 操作 





4. 空 
空 操 作 检 查 队 列 的 状态 ， 格 式 如 下 : 


empty (queueName) 


queueName 是 队列 的 名 字 。 如 果 队 列 为 空 ， 则 这 个 操作 返回 真 ， 否 则 返回 假 。 
12.3.2 ”队列 抽象 数据 类 型 


我 们 定义 队列 的 抽象 数据 类 型 如 下 : 

队列 的 抽象 数据 类 型 

定义 : ”队列 是 一 种 线性 列表 ,该 表 中 的 数据 只 能 在 称 为 头 部 的 一 端 删除 ， 并 且 只 能 在 称 为 
尾部 的 一 端 插入 。 

操作 :queue: 创建 一 个 空 的 队列 。 queue (Q) Q[ 
enqueue: 在 尾部 插入 一 个 元 素 。 i ob 
dequeue: 在 头 部 删除 一 个 元 素 。 
empty: 检查 队列 的 状态 。 enqueue (Q, 12) Q fo12 

例 12.4 图 12-12 显示 了 应 用 原先 定义 |if (not, empty(Q)) dequeue (Q, x) Q [52 


在 队列 Q 上 的 操作 的 算法 片段 。 第 4 个 操作 
在 队 首 出 列 前 检查 队列 的 状态 。 队 首 元 素 的 值 EQ ole2 
被 存储 在 变量 x 中， 但是， 我 们 并 不 使 用 它 ， 全 和 

在 算法 片段 结束 时 ， 它 将 被 自动 丢弃 。 


12.3.3 ”队列 的 应 用 


队列 是 最 常用 的 数据 处 理 结构 之 一 。 事 实 上 ， 在 所 有 的 操作 系统 以 及 网 络 中 都 有 队列 的 
身影 ， 在 其 他 技术 领域 更 是 数不胜数 。 例 如 ， 队 列 应 用 于 在 线 电 子 商 务 应 用 程序 ， 如 处 理 用 
户 需 求 、 任 务 和 指令 。 在 计算 机 系统 中 ， 需 要 用 队列 来 完成 对 作业 或 对 系统 设备 (如 打印 池 ) 
的 处 理 。 

例 12.5 通过 数据 的 一 些 特性 ， 队 列 可 以 用 于 组 织 数 据 库 。 例 如 ， 假设 在 计算 机 中 有 
一 有 序 的 数据 表 ， 数 据 分 成 两 类 : 小 于 1000 和 大 于 1000。 我 们 可 以 使 用 两 个 队列 分 隔 这 个 
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类 别 ， 并 同时 维护 它们 所 在 类 别 中 的 数据 顺序 。 算 法 12.3 显示 了 这 个 操作 的 伪 代 码 。 
算法 12.3 例 12.5 


算法 : Categorizer (1ist) 
目的 ; 把 数据 分 成 两 类 ， 建立 两 个 分 离 的 表 
前 提 : 给 定 原始 表 
后 续 : 打印 两 个 表 
返回 : 无 
{ 
queue (Q1) 
queue (0Q2) 
while (more data in the list) 
{ 
if (data <1000) 
{ 
enqueue (Ql1, data) 
} 
if (data 宇 1000) 
{ 
enqueue (Q2, data) 
} 
} 
while (not empty(Q1)) 
{ 
dequeue (Ql1, x) 
print (x) 
} 
while (not empty (0Q2)) 
{ 
dequeue (Q2, x) 
print (x) 
} 
return 


} 


例 12.6 队列 的 另 一 个 常用 的 应 用 是 调节 和 建立 数据 的 快速 生成 和 数据 缓慢 消费 间 的 
平衡 。 例 如 ， 假 设 CPU 与 打印 机 相连 ,打印 机 的 速度 是 不 能 跟 CPU 的 速度 相 比 的 。 如 果 
CPU 等 待 打印 机 去 打印 CPU 生成 的 数据 ， 那 么 CPU 将 要 空闲 好 长 时 间 。 解 决 方法 就 是 队 
列 ，CPU 生成 队列 能 容纳 的 数据 块 ， 并 把 这 些 数据 块 放 人 队列 中 。CPU 现在 就 腾 出 来 去 做 
其 他 工作 了 。 数 据 块 慢 慢 地 被 从 队列 中 取出 ， 并 慢 慢 地 被 打印 。 用 作 这 种 目的 的 队列 通常 称 
为 假 脱 机 队列 。 


12.3.4 ”队列 的 实现 


在 抽象 数据 类 型 层次 上 ， 我们 使 用 队列 及 其 4 个 操作 (queue、enqueue、dequeue 和 
empty) ; 在 实现 的 层次 上 ， 我 们 需要 选择 数据 结构 来 实现 它们 。 队 列 抽 象 数 据 类 型 可 以 使 用 
数组 或 链表 来 实现 。 图 12-13 显示 了 一 个 有 5 个 数据 项 的 队列 抽象 数据 类 型 的 例子 。 图 中 还 
显示 了 我 们 是 如 何 实现 队列 的 。 

在 数组 实现 中 ， 我们 有 带 有 三 个 域 的 记录 。 第 一 个 域 用 来 存储 关于 队列 的 信息 : 我 们 把 
它 当 作 计 数 域 ， 在 任何 时 刻 其 中 显示 的 是 队列 中 数据 项 的 数目 。 第 二 个 域 是 含有 队 首 元 素 序 
号 的 一 个 整数 。 第 三 个 域 也 是 一 个 整数 ， 它 含有 队 尾 元 素 的 序号 。 
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[me 


尾 
a) 抽象 数据 类 型 





计数 头 尾 
b) 数组 实现 


~ 


计数 头 尾 
c) 链表 实现 
图 12-13 ”队列 的 实现 


链表 的 实现 是 相似 的 : 我 们 有 一 个 有 队列 名 字 的 额外 节点 ， 这 个 节点 也 有 三 个 域 : 一 个 
计数 器 、 一 个 指向 队 首 元 素 的 指针 和 一 个 指向 队 尾 元 素 的 指针 。 

算法 

可 以 用 伪 代 码 写 出 我 们 为 每 种 实现 定义 的 4 种 操作 。 在 第 11 章 中 显示 了 处 理 数组 和 链 
表 的 算法 ， 这 些 算 法 可 以 被 修改 成 队列 中 我 们 需要 的 4 种 算法 : queue、enqueue 、dequeue 
和 empty。 这 些 算法 甚至 比 第 11 章 中 那些 算法 更 简单 ， 因 为 插入 只 在 队 尾 进行 ， 而 删除 只 
在 队 首 进行 。 我 们 把 这 些 算法 的 编写 留 作 练习 。 


12.4 广义 线性 表 


前 两 节 中 介绍 的 栈 和 队列 都 是 限制 线性 表 。 广 义 线性 表 是 像 插 入 和 删除 等 操作 可 以 在 其 
中 任何 地 方 进行 的 表 ， 可 以 在 表 头 、 表 中 间或 表 尾 。 图 12-14 显示 了 一 个 广义 线性 表 。 

我 们 把 广义 线性 表 定 义 成 具有 如 下 特性 的 元 素 集合 : 

。 元 素 具 有 相同 的 类 型 ; 


e 元 素 顺序 排列 ， 这 意味 着 有 第 一 个 元 素 和 最 后 一 个 元 素 ; 

。 除 第 一 个 元 素 外 每 个 元 素 都 有 唯一 的 前 驱 ; 除 最 后 一 个 元 素 外 每 个 元 素 都 有 唯一 的 后 继 ; 
e 每 个 元 素 是 一 个 带 有 关键 字段 的 记录 ; 

。 元 素 按 关键 字 值 排序 。 





广义 线性 表 
图 12-14 广义 线性 表 


12.4.1 广义 线性 表 的 操作 


虽然 可 以 定义 许多 广义 线性 表 的 操作 ， 但 本 章 仅 讨论 6 种 常用 的 操作 : 建 表 、 插 入 、 册 
除 、 检 索 、 遍 历 和 空 。 
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1. 建 表 操作 
建 表 操作 建立 一 个 空 表 ， 格 式 如 下 : 


list(listName) 


listName 是 要 建立 的 广义 线性 表 的 名 字 。 这 个 操作 返回 一 个 空 表 。 

2. 插 人 操作 

既然 我 们 假定 广义 线性 表 中 的 数据 是 已 排序 的 ， 那么 插入 就 必须 在 保持 元 素 顺序 的 方 
式 下 进行 。 为 了 判定 元 素 的 插入 位 置 ， 就 需要 查找 了 。 但 是 ， 查 找 是 在 实现 层 上 进行 的 ， 而 
不 是 在 抽象 数据 类 型 层 上 。 另 外 ， 为 了 简单 起 见 ， 我 们 假设 在 广义 线性 表 中 不 允许 重复 的 数 
据 。 因 此 ， 我 们 把 元 素 插 在 能 保持 关键 字 顺 序 的 地 方 。 格 式 如 下 : 


insert (listName, element) 


图 12-15 图 形 化 地 显示 了 插入 操作 。 





要 插入 的 元 素 
图 12-15 插入 操作 


3. 删除 操作 
从 广义 表 中 删除 数据 也 需要 查找 表 找 到 删除 数据 在 表 中 的 位 置 (图 12-16 )。 当 数据 的 位 
置 被 找到 后 ， 删 除 操 作 就 能 进行 了 。 格 式 如 下 : 


delete (listName, target, element) 


target 是 与 表 中 元 素 关键 字 具 有 相同 类 型 的 数据 值 。 如 果 关 键 字 值 与 目标 相等 的 元 素 被 
发 现 ， 这 个 元 素 将 被 删除 。 图 12-16 图 形 化 地 显示 了 删除 操作 。 

注意 这 个 操作 返回 被 删除 的 元 素 ， 如 果 我 们 需要 改变 某 些 域 的 值 ， 并 把 数据 项 重新 插入 
表 中 ， 那 这 个 返回 值 就 是 需要 的 。 我 们 并 没有 在 表 上 定义 任何 改变 域 值 的 操作 。 





图 12-16 ”删除 操作 


4. 检索 操作 
检索 的 意思 是 单个 元 素 的 存 取 。 像 插入 和 删除 操作 一 样 ， 广 义 表 首先 被 查找 ， 数 据 被 发 
现 ， 才 能 被 检索 。 格 式 如 下 : 
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retrieve (listName, target, element) 


target 是 与 表 中 元 素 关键 字 具 有 相同 类 型 的 数据 值 。 图 12-17 图 形 化 地 显示 了 检索 操作 。 
如 果 关 键 字 值 与 目标 相等 的 元 素 被 发 现 ， 这 个 元 素 的 副本 被 检索 ， 该 元 素 还 留 在 表 中 。 


要 检索 的 元 素 其 余数 据 






表 (检索 前 ) [0[ 上 BE | 园 | 6 元 素 上 Ci] 
关键 字 


目标 25 一 > 国 人 2 人 二 本 EU 本 2) 


表 (检索 后 ) EL “| 6 “| 图 | Bo | 


图 12-17 检索 操作 


5. 遍历 操作 
前 面 的 每 一 个 操作 只 涉及 表 中 的 一 个 元 素 ， 随 机 地 存 取 表 ， 而 表 的 遍历 涉及 表 的 顺序 存 


取 。 这 是 一 个 其 中 表 中 所 有 的 元 素 逐 一 被 处 理 的 操作 。 格 式 如 下 : 


traverse (listName, action) 


遍历 操作 顺序 地 存 取 表 中 元 素 ， 而 动作 指明 了 在 每 个 元 素 上 进行 的 操作 。 动 作 的 一 些 例 
子 是 打印 数据 、 在 数据 上 应 用 某 些 数学 操作 等 。 

6. 空 操 作 

空 操作 检查 表 的 状态 ， 格 式 如 下 


empty (listName) 


listName 是 表 的 名 字 ， 如 果 表 是 空 的 ， 该 操作 返回 真 ， 如 果 表 非 空 ， 则 返回 假 。 


12.4.2 ”广义 线性 表 的 抽象 数据 类 型 


广义 线性 表 的 抽象 数据 类 型 定义 如 下 : 
广义 线性 表 的 抽象 数据 类 型 
定义 : ”一 个 有 序 的 数据 项 表 ， 所 有 的 项 具有 相同 类 型 。 
操作 : ”list: 创建 一 个 空 表 。 
insert: 在 表 中 插 人 一 个 元 素 。 
delete: 从 表 中 删除 一 个 元 素 。 
retrieve: 从 表 中 检索 一 个 元 素 。 
traverse: 顺序 地 遍历 表 。 
empty: 检查 表 的 状态 。 
例 12.7 图 12-18 显 示 了 在 表 L 上 
应 用 前 面 定 义 的 操作 的 一 个 算法 片段 。 注 
意 第 三 个 操作 把 新 数据 插 在 了 正确 的 位 
置 ， 因 为 插入 操作 调用 了 实现 层 上 的 查找 |if (notempty (CD) delete (L, 3) 
算法 ,找到 了 新 数据 应 该 被 插入 的 位 置 。 |insert (L, 6) 
第 4 个 操作 要 求 从 表 中 删除 数据 项 算法 片段 
3。 它 调用 了 空 操 作 来 确保 表 是 非 空 的 。 图 12-18 例 12.7 


list (L) 
insert (L, 10) 


insert (L, 9) 
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因为 表 是 非 空 的 ， 那 操作 就 可 以 进行 。 但 是 ， 当 它 调 用 实现 层 的 查找 算法 时 ， 在 表 中 并 没有 
找到 数据 项 。 因 此 ， 表 就 无 变化 地 被 返回 了 。 最 终 最 后 一 个 操作 把 6 插 在 合适 的 位 置 上 。 


12.4.3 ”广义 线性 表 的 应 用 


广义 线性 表 可 应 用 于 元 素 被 随机 存 取 或 顺序 存 取 的 情况 。 例 如 ， 在 大 学 里 ， 线 性 表 可 以 
用 来 存储 每 个 学 期 人 学 的 学 生 信息 。 

例 12.8 假设 一 个 大 学 有 一 个 广义 线性 表 ， 表 中 存 有 关于 学 生 的 信息 ， 每 个 数据 元 素 
是 一 个 带 有 三 个 域 的 记录 : ID 、Name 和 Grade。 算 法 12.4 显示 了 一 个 帮助 教授 修改 学 生成 
绩 的 算法 。 删 除 操作 从 表 中 删除 一 个 元 素 ， 这 样 才 允许 程序 修改 成 绩 。 插 和 人 操作 把 修改 的 元 
素 插 回 表 中 。 元 素 含 有 学 生 的 整个 记录 ， 目 标 是 用 来 查找 表 的 ID。 


算法 12.4 例 12.8 


算法 : ChangeGrade (StudentList, target, grade) 
目的 : 修改 学 生 的 成 绩 
前 提 : 给 定 学 生 表 和 和 成绩 
后 续 : 无 
返回 : 无 
{ 
delete (StudentList, target, element) 
(element .data) .Grade 0 grade 
insert (StudentList, element) 
return 


} 
例 12.9 继续 例 12.8， 假设 辅导 教师 在 学 期 末 要 打印 所 有 学 生 的 记录 。 算 法 12.5 能 做 
这 个 工作 。 二 
我 们 假定 有 一 个 称 为 Print 的 算法 能 打印 出 记录 的 内 容 。 对 于 每 个 节点 ， 表 遍历 调用 
Print 算法 ， 并 传递 要 打印 的 数据 给 它 。 


算法 12.5 例 12.9 


算法 : PrintRecord(StudentList) 

目的 : 打印 StudentList 中 的 所 有 学 生 的 记录 

前 提 : 给 定 学 生 列 表 

后 续 : 无 

返回 : 无 

{ 
traverse (StudentList, Print) 
return 


} 


12.4.4 ”广义 线性 表 的 实现 


在 抽象 数据 类 型 层次 上 ， 我 们 使 用 表 及 其 6 个 操作 (list、insert、delete、retrieve、tra- 
verse 和 empty) ; 在 实现 的 层次 上 ， 我 们 需要 选择 数据 结构 来 实现 它们 。 广 义 线性 表 抽 象 数 
据 类 型 可 以 使 用 数组 或 链表 来 实现 。 图 12-19 显示 了 一 个 有 5 个 数据 项 的 表 抽 象 数据 类 型 的 
例子 。 图 中 还 显示 了 我 们 是 如 何 实 现 表 的 。 

在 数组 实现 中 ， 我 们 有 带 有 两 个 域 的 记录 。 第 一 个 域 用 来 存储 关于 数组 的 信息 : 我 们 把 
它 当 作 计 数 域 ， 其 中 显示 的 是 表 中 当前 数据 项 的 数目 。 第 二 个 域 是 含有 表 中 首 元 素 序 号 的 一 
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个 整数 。 链 表 的 实现 是 相似 的 : 我 们 有 一 个 有 表 名 字 的 额外 节点 ， 这 个 节点 也 有 两 个 域 : 一 
个 计数 器 和 一 个 指向 首 元 素 的 指针 。 





[| -丁丁 一 村 一 村 一 
a) 抽象 数据 类 型 
1] [2] [3] [4] [5] [6] 四 
CC SS — 
计数 头 b) 数组 实现 
i es ee es | 
计数 头 0) 链表 实现 


图 12-19 广义 线性 表 的 实现 
算法 
可 以 用 伪 代 码 为 表 的 每 种 实现 定义 的 6 种 操作 。 在 第 11 章 中 显示 了 处 理 数组 和 链表 的 
算法 ， 这 些 算法 稍 作 修 改 ， 就 成 为 我 们 所 需要 的 表 的 算法 。 我 们 把 这 些 算法 的 编写 留 作 练习 。 


12.5 树 


树 包括 一 组 有 限 的 元 素 ， 称 为 节点 (或 顶点 )， 同 时 包括 一 组 有 限 的 有 向 线段 ， 用 来 连 
接 节点 ， 称 为 弧 。 如 果树 是 非 空 的 ， 其 中 有 一 个 节点 没有 进入 的 弧 ， 该 节点 称 为 根 。 树 中 的 
其 他 节点 都 可 以 沿 着 从 根 开始 的 唯一 路 径 到 达 ， 该 路 径 是 指 一 系列 相 邻 连接 的 节点 序列 。 树 
的 结构 通常 被 画 成 上 下 颠倒 ， 根 在 顶部 ( 见 图 12-20 ) 。 





图 12-20 树 的 示意 图 


我 们 可 以 把 树 中 的 顶点 分 成 三 类 : 根 、 叶 子 和 内 部 节点 。 
We 显示 了 每 种 节点 允许 的 外 出 弧 和 进入 弧 活 和 2 剖 六 二 和 外 出生 的 扫 目 

从 一 给 定 节点 可 以 直接 到 达 (通过 一 个 弧 ) 的 
节点 称 为 子 节点 ; 从 其 出 发 子 节点 可 以 直接 到 达 的 
节点 称 为 双亲 。 具 有 相同 双亲 的 节点 称 为 兄弟 节点 。 
节点 的 子孙 是 指 从 该 节点 出 发 可 以 到 达 的 所 有 节点 ， 
而 从 其 出 发 所 有 的 子孙 都 可 以 到 达 的 节点 称 为 祖先 。 
树 中 每 个 节点 都 有 可 能 有 子 树 。 

每 个 节点 的 子 树 含有 子 节点 中 的 一 个 和 这 个 子 节点 的 所 有 子孙 。 图 12-21 显示 了 图 12-20 
中 的 树 的 所 有 子 树 。 

虽然 树 在 计算 机 科学 中 有 许多 应 用 ， 如 索引 文件 等 ， 但 它们 的 研究 超出 了 本 书 的 范围 。 
我 们 把 树 的 介绍 作为 一 种 特殊 的 树 一 一 三 又 树 的 前 序 。 
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图 12-21 子 树 


12.5.1 二叉树 
根 


二 叉 树 是 一 棵 树 ， 且 其 中 没有 一 个 
节点 所 含有 的 子 树 的 个 数 超过 两 个 。 换 句 2 
话说 ， 任 一 个 节点 只 能 有 0、1 或 是 2 棵 
子 树 。 这 些 子 树 被 描述 为 左 子 树 和 右 子 
树 。 图 12-22 给 出 了 一 棵 有 两 棵 子 树 的 二 
叉 树 。 注 意 每 一 棵 子 树 本 身 也 是 一 棵 二 
叉 树 。 左 子 树 右 子 树 

二 叉 树 的 递归 定义 图 12-22 一 又 树 

在 第 8 章 中 ,我 们 介绍 了 算法 的 递归 定义 。 我 们 也 能 递归 定义 一 个 结构 或 一 个 抽象 数据 
类 型 。 下 面 给 出 了 二 叉 树 的 递归 定义 。 注 意 ， 基 于 这 个 定义 ， 二 叉 树 可 以 有 一 个 根 ， 而 每 棵 
子 树 也 可 以 有 一 个 根 。 : 


ee 
~ 


图 12-23 二 叉 树 的 例子 








”12.5.2 ”二叉树 的 操作 
二 叉 树 中 6 种 最 常用 的 操作 是 建树 (创建 一 棵 空 树 )、 插 入 、 删 除 、 检 索 、 空 和 遍历 ， 
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前 5 种 超出 了 本 书 的 范围 。 本 节 只 讨论 二 又 树 的 遍历 。 

二 叉 树 的 遍历 

二 又 树 遍 历 要 求 按照 预定 的 顺序 处 理 每 一 个 节点 上 且 仅 处 理 一 次 。 两 种 常用 的 遍历 次 序 是 
深度 优先 和 广度 优先 。 

(1 ) 深度 优先 遍历 

给 定 一 棵 由 根 、 左 子 树 、 右 子 树 构成 的 二 又 树 ， 我 们 可 以 定义 6 种 不 同 的 深度 优先 遍历 
次 序 。 计 算 机 科学 家 已 经 在 文献 定义 了 其 中 三 种 的 标准 名 称 。 另 外 三 种 没有 名 称 但 很 容易 导 
出 。 图 12-24 中 给 出 了 标准 遍历 。 


各 NN ~ 


左 子 树 。“ 右 子 树 左 子 树 。 右 子 树 左 子 树 。” 右 子 树 
a) 前 序 遍历 b) 中 序 遍历 c) 后 序 遍历 


图 12-24 ”二叉树 的 深度 优先 遍历 


e 前 序 遍 历 。 在 前 序 遍 历 中 ， 根 被 首先 访问 ， 接 着 是 左 子 树 ， 最 后 是 右 子 树 。 前 缀 pre 
表示 根 在 子 树 前 面 被 处 理 。 
e 中 序 遍 历 。 在 中 序 遍 历 中 ， 先 处 理 左 子 树 ， 然 后 是 根 ， 最 后 是 右 子 树 。 前 级 in 表示 
根 在 子 树 之 间 被 处 理 。 
e 后 序 遍 历 。 在 后 序 遍历 中 ， 根 在 左右 子 树 都 处 理 完 后 才 处 理 。 前 缀 post 表示 根 在 子 
树 之 后 被 处 理 。 
例 12.10 -图 12-25 显示 了 我 们 使 用 前 序 遍 历 访问 树 中 的 每 个 节点 。 图 中 还 显示 了 行走 次 
序 。 在 前 序 遍 历 中 ， 当 我 们 从 左边 经 过 这 个 节点 时 ,访问 该 节点 。 节 点 被 访问 的 顺序 是 A、 
B、C、D、E、F。 





a) 处 理 次 序 b) “行走 ”次 序 
图 12-25 例 12.10 


(2 ) 广度 优先 遍历 - 

在 二 叉 树 的 广度 优先 遍历 中 ， 先 处 理 节点 的 子 节点 ， 然 后 进行 下 一 层 。 就 像 在 深度 优先 
遍历 中 一 样 ， 我 们 也 可 以 用 行走 来 跟踪 遍历 。 

例 12.11 图 12-26 显示 了 我 们 使 用 广度 优先 遍历 访问 树 中 的 每 个 节点 。 图 中 还 显示 了 
行走 的 次 序 。 遍 历 的 顺序 是 : A、B、E、C、D、F。 
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b) “行走 ”次 序 





a) 处 理 次 序 


图 12-26 例 12.11 


12.5.3 二叉树 的 应 用 


二 叉 树 在 计算 机 科学 中 有 许多 应 用 ， 本 节 只 介绍 其 中 的 两 种 : 赫 夫 曼 编 码 和 表达 式 树 。 

1. 赫 夫 曼 编 码 

赫 夫 曼 编码 是 一 种 压缩 技术 ， 它 使 用 二 叉 树 来 生成 一 个 符号 串 的 可 变 长 度 的 二 进 制 纺 
码 。 我 们 将 在 第 15 章 中 详细 讨论 赫 夫 曼 编码 。 

2. 表达 式 树 

一 个 算术 表达 式 可 以 用 三 种 格式 来 表示 : 中 缀 、 后 缀 、 前 缀 。 在 中 缀 表示 中 ， 操 作 符 是 
处 于 两 个 操作 数 中 间 的 ; 在 后 缀 表示 中 ， 操 作 符 是 处 于 两 个 操作 数 之 后 的 ; 在 前 缀 表示 中 ， 
操作 符 是 处 于 两 个 操作 数 之 前 的 。 对 于 两 个 操作 数 A 和 B 的 加 法 运算 ， 这 些 格式 显示 如 下 : 

前 组 : + A B 中 级 : A + B 后 级 : A B + 

虽然 我 们 在 编程 语言 中 使 用 中 绥 表 示 ， 但 编译 程序 经 常 在 计算 表达 式 之 前 需要 把 它们 转 
变 为 后 缀 表示 。 进 行 这 个 转换 的 一 种 方法 就 是 建立 表达 式 树 。 在 表达 式 树 中 ， 根 和 内 部 节点 
是 操作 符 ， 而 叶子 是 操作 数 。 三 种 标准 的 
遍历 (图 12-24 中 前 序 、 中 序 和 后 序 ) 表 
示 了 三 种 不 同 的 表达 式 格式 : 中 缀 、 后 缀 、 
前 缀 。 中 序 遍 历 产生 了 中 缀 表达 式 ; 后 序 
遍历 产生 了 后 缀 表达 式 ; 前 序 遍 历 产 生 了 
前 缀 表达 式 。 图 12-27 显示 了 表达 式 和 表 
达 式 树 。 注 意 只 有 中 缀 表示 法 需要 括号 。 表达 式 树 


12.5.4 ”二叉树 的 实现 图 12-27 表达 式 树 

二 叉 树 可 以 使 用 数组 或 链表 来 实现 。 对 于 删除 和 插入 操作 ， 链 表 实 现 的 效率 要 高 ， 所 以 
更 为 流行 。 
12.5.5 二 又 搜 索 树 


二 叉 搜 索 树 (BST) 是 一 种 具有 额外 特性 的 二 叉 树 : 每 
个 节点 的 关键 字 值 大 于 左 子 树 中 的 所 有 节点 的 关键 字 值 ， 而 
小 于 右 子 树 中 所 有 节点 的 关键 字 值 。 图 12-28 显示 了 这 样 的 
思想 。 图 12-28 二 又 搜索 树 (BST) 
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例 12.12 12-29 显示 了 一 些 二 叉 搜索 树 和 一 些 非 二 又 搜 索 树 。 注 意 如 果 所 有 子 树 是 
二 又 搜 索 树 ， 并 且 整 棵 树 也 是 二 又 搜 索 树 ， 那 这 棵 树 才 是 二 又 搜 索 树 。 


A 


图 12-29 例 12.12 


BST 一 个 非常 有 趣 的 特性 是 :如果 我 们 对 二 叉 树 应 用 中 序 遍 历 ， 被 访问 的 元 素 以 升序 排 
列 。 例 如 ， 在 图 12-29 中 ， 当 使 用 中 序 
遍历 时 ， 得 到 列表 : (3，6，17 )、( 17， 
19) 和 (3，6， 
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BST 的 另 一 个 有 趣 的 特性 是 : 我 们 
能 对 二 又 搜索 树 使 用 在 第 8 章 中 使 用 的 
折 半 查找 。 图 12-30 显示 了 BST 搜索 的 
UML 图 。 


12.5.6 ”二 叉 搜索 树 的 抽象 数据 类 型 


二 又 树 的 抽象 数据 类 型 与 我 们 为 具 

有 相同 操作 的 广义 线性 表 所 定义 的 抽象 因 1290 二 况 搜 索 树 因由 所 注 基 
数据 类 型 相似 。 事 实 上 ， 如 今 BST 表 比 广义 线性 表 更 为 常见 ， 因 为 BST 的 查找 效率 比 广义 
线性 表 要 高 ， 广 义 线性 表 中 只 能 使 用 顺序 查找 ， 而 BST 中 可 以 使 用 折 半 查找 。 


12.5.7 二 叉 搜 索 树 的 实现 


BST 可 以 使 用 数组 或 链表 来 实现 。 但 是 ， 链 表 结 构 更 为 常见 并 且 效 率 更 高 。 线 性 实现 使 
用 带 有 两 个 指针 的 节点 : 左 指针 和 右 指针 。 左 指针 指向 左 子 树 ， 右 指针 指向 右 子 树 。 如 果 左 
子 树 为 空 ， 则 左 指针 也 为 空 ， 如 果 右 子 树 为 空 ， 则 右 指针 也 为 空 ， 像 广义 线性 表 的 链表 实现 
一 样 ，BST 的 链表 实现 也 使 用 一 个 与 BST 具有 相同 名 字 的 虚构 节点 。 该 虚构 节点 的 数据 部 
分 含有 关于 树 的 信息 ， 如 树 中 的 节点 数目 。 指 针 部 分 指向 树 的 根 。 图 12-31 显示 了 一 棵 二 又 
搜索 树 ， 其 中 每 个 节点 的 数据 域 是 一 个 记录 。 


计数 根 
T 









target> root.key] 


Or 


图 12-31 二 叉 搜 索 树 的 实现 
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12.6 图 


图 是 由 一 组 节点 ( 称 为 项 点 ) 和 一 组 顶点 间 的 连 线 ( 称 为 边 或 弧 ) 构成 的 一 种 抽象 数据 
类 型 。 树 是 定义 成 层次 结构 的 ， 节 点 只 能 有 一 个 双亲 ， 而 图 中 的 节点 可 以 有 一 个 或 多 个 双 
亲 。 图 可 能 是 有 向 的 或 无 向 的 。 在 有 向 图 中 ， 连 接 两 个 顶点 的 边 都 有 从 一 个 顶点 到 另 一 个 
顶点 的 方向 (在 图 中 用 箭头 表示 )。 在 无 向 图 
中 ， 边 是 没有 方向 的 。 图 12-32 显示 了 一 个 有 
向 图 (a) 和 一 个 无 向 图 (b) 的 例子 。 

图 中 的 顶点 可 以 代表 对 象 或 概念 ， 边 或 弧 
可 以 代表 这 些 对 象 或 概念 间 的 关系 。 如 果 图 是 
有 向 的 ， 那 么 关系 就 是 单 向 的 ; 如 果 图 是 无 向 ) 有 向 图 b) 无 向 图 
的 ， 那么 关系 就 是 双向 的 。 

例 12.13 城市 的 地 图 和 连接 城市 的 道路 
可 以 表示 成 计算 机 中 的 一 个 无 向 图 。 城 市 是 顶点 ， 无 向 边 是 连接 它们 的 道路 。 如 果 我 们 要 显 
示 出 城市 间 的 距离 ， 可 以 使 用 加 权 图 ， 其 中 的 每 条 边 都 有 一 个 权重 ,该 权重 表示 由 这 条 边 连 
接 的 两 个 城市 间 的 距离 。 

例 12.14 图 的 另 一 个 应 用 是 在 计算 机 网 络 (第 6 章 ) 中 的 应 用 。 顶 点 可 以 代表 节点 或 
集线器 ， 边 可 以 代表 路 由 。 每 条 边 都 有 一 个 权重 ， 表 示 从 一 个 集线器 到 相 邻 集线器 的 代价 。 
路 由 器 能 使 用 图 算法 找到 它 与 包 最 终 目 的 地 间 的 最 短路 径 。 


12.7 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 
e Gilberg, R. and Forouzan, B. Data Structure - A Pseudocode Approach with C, Boston, 
MA: Course Technology, 2006 
© Goodrich, M. and Tamassia, R. Data Structures and Algorithms in Java, New York: 
Wiley, 2005 
© Nyhoff, L. ADTs, Data Structure, and Problem Solving with C++, Upper Saddle River, 
NJ: Prentice Hall, 2005 
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小 结 


虽然 多 种 简单 数据 类 型 在 所 有 的 编程 语言 中 已 经 被 实现 ， 但 是 大 多 数 语言 并 没有 定义 复 
杂 的 数据 类 型 。 抽 象 数据 类 型 (ADT) 是 一 个 定义 新 数据 类 型 、 定 义 该 数据 类 型 的 操作 以 及 
封装 数据 和 操作 的 包 。 
e 栈 是 一 种 限制 线性 列表 ， 该 列表 中 的 添加 和 删除 被 限制 在 称 为 栈 项 的 一 端 进行 。 如 
果 我 们 把 一 系列 数据 项 插入 栈 中 ， 然 后 又 移 除 它们 ， 那 么 数据 的 次 序 就 被 颠倒 了 。 
这 个 倒 排 的 属性 就 是 栈 被 称 为 后 进 先 出 (LIFO) 的 原因 。 我 们 定义 栈 的 4 种 基本 操 
作 : 建 栈 、 入 栈 、 出 栈 和 空 。 
。 队列 是 一 种 线性 列表 ， 且 数据 的 插入 只 能 在 称 为 尾部 的 一 端 进行 ， 而 数据 的 删除 只 
能 在 称 为 头 部 的 另 一 端 进行 。 这 种 限制 保证 了 通过 队列 数据 被 处 理 的 次 序 就 是 数据 
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12.8 
小 测验 


被 接收 的 次 序 。 换 言 之 ， 队 列 是 一 种 先进 先 出 (FIFO) 结构。 我 们 为 队列 定义 了 4 
种 基本 的 操作 : 建 队 列 、 入 列 、 出 列 和 空 。 广 义 线性 表 是 一 种 像 插入 和 删除 等 操作 
可 以 在 表 其 中 任意 位 置 进行 的 表 ， 可 以 在 头 部 、 中 间或 尾部 。 我 们 为 广义 线性 表 定 
义 了 6 种 操作 : 建 表 、 插 和 入、 删除、 检索 、 遍 历 和 空 。 

树 包括 一 组 有 限 的 元 素 ， 称 为 节点 (或 顶点 )。 同 时 包括 一 组 有 限 的 有 向 线段 ， 用 来 
连接 节点 ， 称 为 绝 。 如 果树 非 空 ， 则 有 一 个 没有 进入 弧 的 节点 称 为 根 。 二 叉 树 是 其 
中 没有 节点 而 有 多 于 两 棵 子 树 的 树 。 换 言 之 ， 节 点 只 能 有 0 棵 、1 棵 或 2 棵 子 树 。 二 
又 树 的 遍历 要 求 以 预定 的 顺序 访问 树 的 每 一 个 节点 且 仅 访问 一 次 。 遍 历 序列 的 两 种 
主要 方法 是 深度 优先 和 广度 优先 。 二 又 搜索 树 (BST) 是 一 种 具有 额外 特性 的 二 又 
树 : 每 个 节点 的 关键 字 值 大 于 左 子 树 中 的 所 有 节点 的 关键 字 值 ， 而 小 于 右 子 树 中 所 
有 节点 的 关键 字 值 。 

图 是 由 一 组 节点 ( 称 为 项 点) 和 一 组 顶点 间 的 连 线 ( 称 为 边 或 狐 ) 构成 的 一 种 抽象 数 
据 类 型 。 树 是 定义 成 层次 结构 的 ， 节 点 只 能 有 一 个 双亲 ， 而 图 中 的 节点 可 以 有 一 个 
或 多 个 双亲 。 图 可 能 是 有 向 的 或 无 向 的 。 


练习 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 继续 本 章 习 题 前 首先 
完成 相关 测验 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 什么 是 抽象 数据 类 型 ? 在 抽象 数据 类 型 中 ,什么 是 已 知 的 ?什么 是 隐藏 的 ? 
2. 什么 是 栈 ? 本 章 定义 的 4 种 栈 的 基本 操作 是 什么 ? 

3. 什么 是 队列 ? 本 章 定义 的 4 种 队列 的 基本 操作 是 什么 ? 

4. 什么 是 广义 线性 表 ? 本 章 定义 的 6 种 广义 线性 表 的 基本 操作 是 什么 ? 

5. 定义 一 棵 树 ， 区 分 树 和 二 叉 树 ， 区 分 二 叉 树 和 二 叉 搜 索 树 。 

6. 二 叉 树 的 深度 优先 遍历 和 广度 优先 遍历 有 何不 同 ? 

7. 什么 是 图 ? 有 向 图 和 无 向 图 的 区 别 是 什么 ? 

8. 列 出 栈 和 队列 的 一 些 应 用 。 

9. 列 出 广义 线性 表 的 一 些 应 用 。 

10. 列 出 二 叉 树 和 二 叉 搜 索 树 的 一 些 应 用 。 


练习 题 


1. 写 出 一 个 算法 的 片段 ， 使 用 while 循环 清空 栈 S2 中 的 内 容 。 

2. 写 出 一 个 算法 的 片段 ， 用 一 个 while 循环 语句 把 栈 S1 内 容 移 到 栈 S2。 操 作 后 栈 S1 的 内 容 为 空 。 

3. 写 出 一 个 算法 的 片段 ， 用 一 个 while 循环 语句 把 栈 S1 内 容 复制 给 栈 S2。 操 作 后 栈 S1 和 栈 S2 的 内 
容 应 该 相同 。 

4. 写 出 一 个 算法 的 片段 ， 用 一 个 while 循环 语句 连接 栈 S1 与 栈 S2， 并 且 连 接 后 栈 S2 中 的 元 素 位 于 栈 
S1 顶端。 栈 S2 应 为 空 。 

5. 给 出 在 执行 下 列 算法 片段 后 栈 S1 的 内 容 和 变量 x 和 y 的 值 


stack(S1) 
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Push(S1，5) 
push (S1，3) 
Push(S1，2) 
if ( not empty(S1)) 
{ 
pop (S1, x) 
} 
if ( not empty(S1)) 
下 
pop (S1, y) 
} 
push (S1, 6) 


. 回 文 是 一 种 顺 读 与 倒 读 结果 一 致 的 字符 串 。 例 如 ， 如 果 忽 略 其 中 空格 ， 以 下 就 是 回 文 : 


Rble was I ere I saw Elba 


写 出 一 种 算法 ， 用 栈 来 测试 字符 串 是 否 是 回 文 。 
7. 在 伪 代 码 写 出 一 种 用 来 比较 两 个 栈 中 内 容 的 算法 。 
8. 用 一 个 while 循环 语句 来 清空 队列 Q 的 内 容 。 
9. 用 一 个 while 循环 语句 把 队列 Q1 的 内 容 移动 到 队列 Q2。 操 作 后 队列 Q1 应 该 为 空 。 
10. 用 一 个 while 循环 语句 把 队列 Q1 的 内 容 复制 到 队列 Q2。 操 作 后 队列 Q1 和 队列 Q2 应 该 相同 。 
11. 用 一 个 while 循环 语句 把 队列 Q2 中 的 内 容 连接 到 队列 Q1 中 的 内 容 的 后 面 。 连 接 后 ， 队 列 Q2 中 的 
内 容 应 该 位 于 队列 Q1 尾部 。 队 列 Q2 应 该 为 空 。 
12. 写 出 用 来 比较 两 个 队列 的 算法 。 
13. 找 出 下 列 二 叉 树 的 根 : 
a. 后 序 遍 历 树 : FCBDG b. 前 序 遍历 树 : IBCDFEN c. 后 序 遍 历 树 ; CBIDFGE 
14. 一 棵 二 叉 树 有 10 个 节点 。 树 的 中 序 遍 历 和 前 序 遍 历 如 下 。 画 出 这 棵 树 。 
前 序 : JCBADEFIGH 
中 序 : ABCEDFJGIH 
15. 一 棵 二 叉 权 有 8 个 节点 。 中 序 遍 历 和 后 序 遍 历 如 下 。 画 出 这 棵 树 。 
后 序 : FECHGDBA 
中 序 : FECABHDG 
16. 一 棵 二 叉 权 有 7 个 节点 。 中 序 遍 历 和 后 序 遍 历 如 下 。 你 能 画 出 这 棵 树 吗 ? 如 果 不 能 ， 说 明理 由 。 
后 序 : GFDABEC 
中 序 : ABDCEFG 
17. 用 伪 代 码 创建 抽象 数据 类 型 包 ， 使 用 数组 作为 数据 结构 ， 实 现 本 章 为 栈 定义 的 4 种 操作 。 
18. 用 伪 代 码 创 建 抽象 数据 类 型 包 ， 使 用 链表 作为 数据 结构 ， 实 现 本 章 为 栈 定义 的 4 种 操作 。 
19. 用 伪 代 码 创 建 抽象 数据 类 型 包 ， 使 用 数组 作为 数据 结构 ， 实 现 本 章 为 队列 定义 的 4 种 操作 。 
20. 用 伪 代 码 创建 抽象 数据 类 型 包 ， 使 用 链表 作为 数据 结构 ， 实 现 本 章 为 队列 定义 的 4 种 操作 。 
21. 用 伪 代码 创建 抽象 数据 类 型 包 ， 使 用 数组 作为 数据 结构 ， 实 现 本 章 为 广义 线性 表 定 义 的 6 种 操作 。 
22. 用 伪 代 码 创 建 抽象 数据 类 型 包 ， 使 用 链表 作为 数据 结构 ， 实 现 本 章 为 广义 线性 表 定 义 的 6 种 操作 。 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通 过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨 论 材 料 的 理解 。 
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文件 结构 





在 这 一 章 中 ， 我 们 将 讨论 文件 的 结构 。 基 于 不 同 的 应 用 ,使 用 多 种 方法 ,文件 被 存储 在 
辅助 存储 设备 中 。 我 们 还 将 讨论 单个 记录 是 如 何 被 检索 的 。 本 章 是 下 一 章 的 前 序 ， 下 一 章 将 
讨论 相关 文件 的 集合 〈 称 为 数据 库 ) 是 如 何 组 织 和 存 取 的 。 

目标 

。 通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

定义 两 类 存 取 方 法 : 顺序 存 取 和 随机 存 取 ; 
理解 顺序 文件 的 结构 和 它们 是 如 何 更 新 的 ; 
理解 索引 文件 的 结构 和 索引 文件 与 数据 文件 间 的 关系 ; 
理解 散 列 文件 背后 的 概念 ， 说 出 一 些 散 列 方法 ; 
描述 地 址 冲突 和 它们 是 如 何 解决 的 ; 
定义 目录 和 它们 是 如 何 用 来 组 织 文件 的 ; 
区 分 文本 文件 和 二 进 制 文件 。 文 件 是 作为 一 个 单元 看 待 的 外 部 相关 数据 的 集合 。 文 
件 的 主要 作用 是 存储 数据 。 因 为 当 计 算 机 关闭 时 ， 主 存 中 的 内 容 将 丢失 ， 因 此 需要 
用 文件 这 种 更 持久 的 方式 来 存储 数据 。 另 外 ， 数 据 的 集合 经 常 很 大 而 不 能 一 次 全 部 
导入 主 存 中 。 因 此 ， 必 须 能 够 在 一 部 分 数据 留 在 文件 中 的 情况 下 读 写 部 分 数据 。 


13.1 引言 


文件 存储 在 辅助 存储 设备 或 二 级 存储 设备 中 。 两 种 最 常见 的 二 级 存储 设备 是 磁盘 和 磁 
带 。 文 件 在 二 级 存储 设备 中 是 可 读 写 的 。 文 件 也 可 以 以 计算 机 只 能 写 不 能 读 的 形式 存在 。 例 
如 ， 在 系统 监视 器 上 显示 的 信息 ， 就 是 一 种 类 似 于 发 送 到 打印 机 的 数据 形式 的 文件 。 广 义 
上 ,键盘 也 是 文件 ， 虽 然 它 并 不 能 存储 数据 。 

按照 我 们 的 意图 ， 文 件 是 数据 记录 的 集合 ， 每 一 个 记录 都 由 一 个 或 多 个 域 组 成 。 就 像 第 
11 章 中 定义 的 一 样 。 

在 设计 一 个 文件 时 ， 关 键 问题 是 如 何 从 文件 中 检索 信息 〈 一 个 特定 的 记录 )。 有 时 需要 
一 个 接 一 个 地 处 理 记录 ， 有 时 又 需要 快速 存 取 一 个 特定 的 记录 而 不 用 检索 前 面 的 记录 。 存 取 
方法 决定 了 怎样 检索 记录 : 顺序 的 或 者 随机 的 。 





13.1.1 顺序 存 取 

如 果 需 要 顺序 地 存 取 记录 (一 个 接 一 个 ， 从 头 到 尾 )， 则 使 用 顺序 文件 结构 。 
13.1.2 ”随机 存 取 文件 

如 果 想 存 取 某 一 特定 记录 而 不 用 检索 其 之 前 的 所 有 
记录 ， 则 使 用 允许 随机 存 取 的 文件 结构 。 有 两 种 文件 结 
构 都 允许 随机 存 取 ， 索引 文件 和 散 列 文件 。 文 件 结构 的 3 铸 开交 件 


分 类 方法 参见 图 13-1。 图 13-1 文件 结构 的 分 类 
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13.2 顺序 文件 


顺序 文件 是 指 记 录 只 能 按照 顺序 从 头 到 尾 一 个 接 一 个 地 进行 存 取 。 图 13-2 给 出 了 一 个 
顺序 文件 的 设计 。 记 录 被 一 个 接 一 个 地 存储 到 
辅助 存储 器 (磁带 或 磁盘 ) 中 ， 并 在 最 后 的 记 
录 加 上 EOF (文件 末尾 ) 的 标志 。 操 作 系 统 没 
有 有 关 记 录 地 址 的 信息 ， 它 只 知道 记录 是 一 个 
挨 着 一 个 存 取 的 。 

算法 13.1 显示 了 顺序 文件 中 的 记录 是 如 何 处 理 的 ， 我 们 一 个 接 一 个 地 处 理 记录 ， 当 操 
作 系 统 处 理 完 最 后 一 个 记录 时 ， 检 测 到 EOF 标签 并 退出 循环 。 


算法 13.1 顺序 文件 中 记录 处 理 的 伪 代 码 


算法 : SequentialFileProcessing (file) 
作用 : 处 理 顺序 文件 中 的 所 有 记录 

前 提 : 给 定 在 辅助 存储 器 上 的 文件 的 开始 地 址 
后 续 : 无 

返回 : 无 





顺序 文件 
图 13-2 顺序 文件 


while (Not EOF) 
{ 
Read the next record from the auxiliary storage into memory 
Process the record 
} 
Re 
顺序 文件 用 于 需要 从 头 到 尾 存 取 记 录 的 应 用 。 例 如 ， 如 果 公司 里 每 个 职员 个 人 资料 存储 
于 一 个 文件 中 ， 月 底 就 可 以 通过 顺序 存 取 检 索 每 条 记录 来 打印 工资 。 在 这 里 ， 因 为 必须 处 理 
每 一 个 记录 ， 所 以 顺序 存 取 比 随机 存 取 更 简便 有 效 。 
然而 ， 顺 序 文件 对 随机 存 取 来 说 效率 并 不 高 。 例 如 ， 如 果 一 个 银行 的 所 有 客户 记录 只 能 
被 顺序 存 取 ， 那 么 一 个 客户 想 从 自动 取款 机 中 提 款 ， 就 要 等 到 系统 从 头 开 始 查找 直到 找到 这 
名 客户 的 信息 。 如 果 这 个 银行 有 100 万 个 客户 ， 系 统 在 查 到 记录 之 前 平均 要 检索 50 万 个 记 、 
录 。 效 率 是 非常 低 的 。 


更 新 顺序 文件 


顺序 文件 必须 定期 更 新 ， 以 反映 信息 的 变化 。 更 新 过 程 将 非常 坏 手 ， 因 为 所 有 记录 都 要 
被 顺序 地 检查 和 更 新 〈 必 要 的 话 )。 

1. 需要 更 新 的 文件 

和 更 新 程序 有 关 的 一 共有 4 个 文件 : 新 主 文件 、 旧 主 文件 、 事 务 文件 和 错误 报告 文件 。 
所 有 这 些 文件 根据 关键 字 值 被 分 类 。 图 13-3 是 顺序 文件 更 新 的 图 示 。 在 这 个 图 中 ,包含 刚 
刚 讨论 过 的 4 个 文件 。 虽 和 然 我 们 用 了 磁带 的 符号 表示 文件 ， 但 是 我 们 可 以 很 容易 用 磁盘 的 符 
号 表示 。 注 意 在 更 新 完成 之 后 ， 新 主 文件 要 被 送 到 脱 机 存储 器 中 去 ， 直 到 再 次 需要 为 止 。 当 
文件 被 更 新 时 ， 主 文件 将 从 脱 机 存储 器 中 检索 返回 ， 成 为 旧 主 文件 。 

。 新 主 文件 。 新 的 永久 数据 文件 通常 称 为 新 主 文件 。 新 的 主 文件 里 包含 大 部 分 当前 数据 。 

e 旧 主 文件 。 它 是 需要 更 新 的 永久 文件 。 即 使 在 更 新 后 ， 旧 主 文件 作为 参考 将 继续 保留 。 

。 事务 文件 。 第 三 种 文件 是 事务 文件 。 它 包含 将 要 对 主 文件 作 的 改变 。 在 所 有 的 文件 
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更 新 中 ， 一 共有 三 种 基本 类 型 的 改变 。 添 加 事务 包含 将 要 追加 到 主 文件 中 的 新 数据 。 
删除 事务 把 将 要 从 文件 中 删除 的 记录 标识 出 来 。 而 更 改 事 务 则 包含 对 文件 中 特定 记 
录 的 修改 。 要 处 理 这 些 事务 就 需要 键 。 键 就 是 文件 中 一 个 或 多 个 能 唯一 标识 数据 的 
字段 。 例 如 ， 在 一 个 关于 学 生 的 文件 里 ， 键 是 学 生 的 学 号 。 在 一 个 关于 雇员 的 文件 
里 ， 键 是 社会 保险 号 。 

。 错误 报告 文件 。 在 更 新 程序 中 需要 的 第 4 个 文件 是 错误 报告 文件 。 更 新 过 程 中 难免 
不 出 任何 错误 。 当 错误 发 生 时 ， 应 向 用 户 报告 错误 。 错 误 报 告 包括 在 数据 更 新 时 所 
发 现 的 错误 的 清单 ， 并 且 提 供给 用 户 以 进行 纠 错 操作 。 下 一 节 描 述 能 导致 错误 的 一 





新 主 文件 
图 13-3 更 新 顺序 文件 
2. 文件 更 新 过 程 


要 使 文件 更 新 过 程 有 效率 ， 所 有 文件 都 必须 按 同 一 个 。 沪 、 全 虹 和 
键 排序 。 更 新 过 程 如 图 13-4 所 示 。 Nc 
更 新 过 程 要 求 比较 事务 文件 和 主 文件 中 的 键 ， 假 定 在 
没有 错误 发 生 的 情况 下 ， 更 新 过 程 遵循 以 下 步 又 ， A 
1 ) 如 果 事务 文件 的 键 小 于 主 文件 的 键 ， 事 务 就 是 一 个 增加 事务 文件 8 at 
(A)， 则 将 事务 追加 到 新 主 文件 中 。 
2 ) 如 果 事务 文件 的 键 与 主 文件 的 相同 ， 则 
a. 如 果 事务 是 修改 (C)， 则 修改 主 文件 数据 。 
b. 如 果 事务 是 删除 (D)， 则 将 数据 从 主 文件 中 删除 。 
3 ) 如 果 事务 文件 的 键 大 于 主 文件 的 键 ， 将 旧 主 文件 记 新 主 文件 
录 写 人 新 主 文件 。 图 13-4 更 新 过 程 
4 ) 有 几 种 情况 可 能 产生 一 个 错误 ， 错 误 被 记录 在 错误 报告 文件 中 : 
a. 如 果 事 务 定义 追加 一 个 旧 主 文件 中 已 经 存在 的 记录 (相同 键 值 )。 
b. 如 果 事 务 定义 删除 或 修改 一 个 旧 主 文件 中 不 存在 的 记录 。 


13.3 ”索引 文件 


在 文件 中 随机 存 取 记录 ， 需 要 知道 记录 的 地 址 。 例 如 ， 一 个 客户 想 要 查询 银行 账户 。 客 
户 和 出 纳 员 都 不 知道 客户 记录 的 地 址 。 客 户 只 能 给 出 纳 员 自己 的 账号 ( 键 )。 这 里 ， 索 引文 
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件 可 以 把 账号 和 记录 地 址 关联 起 来 (图 13-5 )。 

索引 文件 由 数据 文件 组 成 ， 它 是 带 索 引 的 顺序 文件 。 索 引 本 身 非常 小 ， 只 占 两 个 字段: 
顺序 文件 的 键 和 在 磁盘 上 相应 记录 的 地 址 。 
索引 基于 数据 文件 的 关键 字 值 排序 图 13-6 
给 出 了 索引 文件 的 逻辑 视图 。 





存 取 文件 中 的 记录 需 按 以 下 步骤， 键 地 
1) 整个 索引 文件 都 载 和 内 存 中 (文件 “| 地 直 
很 小 ， 只 占用 很 小 的 内 存 空间 )。 


2 ) 搜索 项 目 ， 用 高 效 的 算法 (如 折 半 9 
查找 法 ) 查找 目标 键 。 
) 检索 记录 的 地 址 。 图 13-5 索引 文件 中 的 映 象 
4 ) 按照 地 址 ， 检 索 数 据 记录 并 返回 给 
用 户 。 


key Addr. 加 key Name Balance 
| 045128 |306 379452| Mary Dodd | 1432.45 | 
070918 | 001 070918| Sarah Trapp | 100.22| 
| 121267 | 002 | 


378845 7234.01 


| 378845 | 007 160252| Tuan Ngo |15121.10| 
| 379452 | 000 045128| Shouli Feldman|87922.05| 


存 取 索 引文 件 





提取 记录 
图 13-6 索引 文件 的 逻辑 视图 


倒 排 文件 


索引 文件 的 好 处 之 一 就 是 可 以 有 多 个 索引 ， 每 个 索引 有 不 同 的 键 。 例 如 ， 职 员 的 文件 可 
以 按 社会 保险 号 或 姓名 来 检索 。 这 种 索引 文件 被 称 为 倒 排 文件 。 


13.4 散 列 文件 


在 索引 文件 中 ， 索 引 将 键 映射 到 地 址 。 散 列 文 件 用 一 个 数学 函数 来 完成 映射 。 用 户 给 出 
键 ， 函 数 将 键 映射 成 地 址 ， 再 传送 给 操作 系统 ， 这 样 就 可 检索 记录 了 (图 13-7 )。 

散 列 文件 无 需 额外 的 文件 〈 索 引 )。 在 索引 文件 中 ， 必 须 将 文件 的 索引 保存 在 磁盘 上 ， 
当 需 要 处 理 数据 文件 时 ， 先 要 把 索引 导 和 人 内 存 中 ， 搜 索索 引 找到 数据 记录 的 地 址 ， 再 访问 数 
据 文件 存 取 记录 。 在 散 列 文件 中 ， 必 琴 数 来 号 我 地 址 。 流 里 不 和 要 案 引 和 了 妥 之 而 来 的 所 有 开 
销 。 然 而 ， 散 列 文件 自身 也 存在 问题 。 
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键 地 址 王 散 列 函 数 〈 键 ) 记录 








映射 


图 13-7 散 列 文件 中 的 映射 


13.4.1 散 列 方法 


在 键 - 地 址 映射 中 ， 可 以 选择 多 种 散 列 方 法 中 的 一 种 。 我 们 将 讨论 其 中 的 几 种 。 

1. 直接 散 列 法 

在 直接 散 列 法 中 ， 键 是 未 经 算法 处 理 的 数据 文件 地 址 。 文 件 因此 必须 对 每 个 可 能 的 键 都 
包含 一 个 记录 。 虽 然 用 直接 散 列 的 情况 很 少 ， 但 它 非 常 有 用 ， 因 为 它 保证 没有 其 他 方法 所 存 
在 的 同义词 或 冲突 问题 (本 章 后 面 介绍 )。 

让 我 们 看 一 个 小 例子 。 假 如 有 一 个 机 构 ， 雇 员 少 于 100 名 。 每 个 雇员 都 被 分 配 一 个 1 到 
100 之 间 的 编号 (雇员 ID )。 在 这 种 情形 下 ， 如 果 建 立 了 一 个 有 100 个 记录 的 文件 ， 雇 员 的 编 
号 可 以 作为 任何 单独 记录 的 地 址 。 这 个 概念 如 图 13-8 所 示 。 键 为 025 ( John Carver) 的 记录 被 
散 列 为 地 址 ( 扇 区 ) 025。 注 意 不 是 文件 中 任何 元 素 都 包含 一 个 雇员 信息 ， 有 些 空间 被 浪费 了 。 


Balance 

001 | 001 |Mary Dodd | 1432.45| 
002 | 002 | Sarah Trapp | 10022| 
|_003 [Bryan Devaux | 1145 

| 004 [Harry Eagle | 14321.00 


004 
| 
散 列 函数 025 0 | 7234.01 | 


099|_099 [Tuan Ngo | 15121.10 
100 [100 [Shouli Feldman| 87922.05 


存 取 直接 散 列 文件 


图 13-8 ”直接 散 列 


虽然 这 是 一 种 理想 的 方法 ， 但 它 的 应 用 非常 有 限 。 例 如 ， 用 社会 保险 号 作为 键 效率 是 非 
常 低 下 的 ， 因 为 社会 保险 号 有 9 位 。 这 样 需要 一 个 有 999 999 999 条 记录 的 巨大 文件 ， 但 是 
可 能 只 用 到 不 到 100 条 记录 。 因 此 ， 让 我 们 把 注意 力 转 到 可 以 把 大 量 可 能 的 键 映射 为 一 个 小 
的 地 址 空间 的 散 列 技术 。 

2. 求 模 法 

求 模 法 也 称 为 除 余 散 列 法 ， 求 模 方法 用 文件 大 小 去 除 键 后 ， 将 余数 加 1 作为 地 址 。 下 面 
给 出 了 一 个 简单 散 列 算法 ， 这 里 list_size 是 文件 中 元 素 的 数目 。 求 模 运 算 的 结果 加 1 是 因为 
我 们 的 表 始 于 1 而 不 是 0。 


240 锚 13 童 


address = key mod list size + 1 


虽然 这 个 算法 适用 于 任何 列表 大 小 ， 但 是 一 个 为 素数 的 列表 大 小 要 比 其 他 的 列表 大 小 产 

更 少 的 冲突 。 因 此 只 要 可 能 ， 尽 量 用 素数 作为 文件 的 大 小 。 

如 果 小 公司 扩大 了 ， 很 快 就 会 发 现 雇员 不 久 将 超过 100 名 。 长 远 起 见 ， 创 建 一 个 新 的 可 
以 处 理 100 万 雇员 的 雇员 编号 系统 。 同 时 决定 提供 可 以 容纳 300 名 雇员 的 数据 空间 。 第 一 
个 大 于 300 的 素数 是 307。 因 此 选择 307 作为 列表 (文件 ) 的 大 小 。 新 的 雇员 列表 和 一 些 散 
列 地 址 如 图 13-9 所 示 。 在 这 种 情况 下 ，Bryan Devaux ， 其 键 为 121267， 被 散 列 到 地 址 003， 
因为 121267 mod 307 = 2， 然 后 再 加 1， 就 可 以 得 到 地 址 003 。 


ee Balance 
i 
i yan Devaux | 1145| 


121267 
地 址 < 一 键 mod 307+1 


散 列 函数 


存 取 求 模 散 列 文件 





图 13-9 求 模 
3. 数字 析 取 法 
如 果 用 数字 析 取 散 列 法 ， 则 选择 从 键 中 析 取 的 数字 作为 地 址 。 例 如 ， 从 6 位 的 员工 编 
号 中 析 取 3 位 地 址 (000 ~ 999 )， 可 以 选择 (从 左 数 ) 第 一 、 第 三 和 第 四 位 数 作为 地 址 。 用 
图 13-9 中 的 键 把 它们 散 列 为 如 下 地 址 : 


125870 158 L22801 = 128 121267 = I]2 


4. 其 他 方法 
还 有 其 他 流行 的 方法 ， 像 平方 中 值 法 、 折 笃 法 、 旋 转 法 和 伪 随 机 法 。 我 们 把 这 几 种 方法 
作为 练习 。 


13.4.2 ”冲突 


通常 散 列 列表 中 键 的 数量 比 在 数据 文件 中 的 记录 数量 要 多 。 例 如 ， 如 果 你 有 一 个 包含 
50 名 学 生 的 班级 的 文件 ， 学 生 由 最 后 4 位 社会 保险 号 标识 ， 这 样 在 文件 中 每 个 元 素 就 有 200 
个 可 能 的 键 (10 000/50 )。 因 为 在 文件 中 有 很 多 键 对 应 于 一 个 地 址 。 有 可 能 多 于 一 个 的 键 将 
被 散 列 为 文件 中 的 同一 个 地 址 。 我 们 把 列表 中 一 些 映 射 为 同一 地 址 的 键 称 为 同义词 。 冲 突 概 


念 参见 图 13-10。 90 


在 图 13-10 中 ， 当 为 两 个 不 同 的 记录 ” 键 二 于 "9 
计算 地 址 时 ， 得 到 相同 的 地 址 (214 )。 显 151564 同一 地 址 ) 
然 ， 两 个 记录 不 能 储存 在 同一 个 地 址 之 中 。 rr 地 址 


需要 按照 下 一 节 所 讨论 的 来 解决 这 种 情况 。 图 13-10 ”冲突 
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如 果 插 入 列表 的 实际 数据 中 有 两 个 或 多 个 同义词 ， 将 产生 冲突 。 冲 突 的 产生 是 在 散 列 算 
法 为 插入 键 产 生地 址 时 ， 发 现 该 地 址 已 被 占用 。 由 散 列 算法 产生 的 地 址 称 为 内 部 地 址 。 包 含 
所 有 内 部 地 址 的 区 域 称 为 主 区 。 当 两 个 键 在 内 部 地 址 上 冲突 时 ， 必 须 将 其 中 一 个 键 和 数据 存 
放 到 主 区 外 的 另 一 个 地 址 单元 中 来 解决 冲突 。 

冲突 解决 法 

除了 直接 法 ， 所 讨论 过 的 散 列 方法 没有 一 种 能 建立 一 一 对 应 的 关系 。 这 就 意味 着 当 新 建 
的 键 散 列 为 地 址 时 ， 将 可 能 产生 冲突 。 有 几 种 方法 来 处 理 冲 突 ， 每 种 都 不 依赖 于 散 列 算法 。 
任何 散 列 方法 都 可 以 用 于 冲突 解决 法 。 下 面 讨 论 其 中 的 一 些 方法 。 

(1 ) 开放 寻 址 

第 一 种 冲突 解决 法 一 一 开放 寻 址 解决 法 ， 解 决 了 在 主 区 的 冲突 。 当 一 个 冲突 发 生 时 ， 主 
区 地 址 将 查找 开放 的 或 空闲 的 记录 来 用 于 存放 新 数据 。 对 于 不 能 在 内 部 地 址 中 存放 的 数据 ， 
一 种 简单 的 策略 就 是 把 该 数据 存储 在 内 部 地 址 的 下 一 个 地 址 中 去 (内 部 地 址 +1 )。 图 13-11 
展示 了 如 何 用 开放 寻 址 解决 法 解决 图 13-10 中 的 冲突 。 第 一 个 记录 存在 地 址 214 中 ， 下 一 个 
记录 存在 地 址 215 中 。 

123013 
地 址 < 一 键 mod 307+1 地 址 ba | 

214— "2151 






151564 
键 地 址 


图 13-11 开放 寻 址 解决 法 





散 列 函数 


(2 ) 链表 解决 法 
开放 寻 址 的 一 个 主要 缺点 是 每 个 冲突 的 解决 增加 了 将 来 冲突 的 可 能 性 。 这 个 弊端 在 
另 一 种 方法 中 得 到 了 解决 一 一 链表 解决 法 。 在 这 种 方法 中 ， 第 一 条 记录 存储 在 内 部 地 址 ， 
但 它 包 含 了 一 个 指向 下 一 条 记录 的 指针 。 图 13-12 展示 了 用 此 方法 如 何 解决 图 13-10 中 冲 
突 的 情况 。 
123013 


刍 地 址 < 一 键 mod 307+1 
151564 


键 


散 列 函数 





图 13-12 ”链表 解决 法 


(3 ) 桶 散 列 法 
另 一 种 处 理 冲突 的 方法 是 散 列 到 桶 。 图 13-13 展示 了 如 何 用 桶 散 列 法 解决 图 13-10 中 的 冲 
突 ， 桶 是 一 能 接纳 多 个 记录 的 节点 。 这 种 方法 的 缺点 是 可 能 有 很 多 浪费 的 (未 占用 的 ) 存储 单元 。 


123013 


地 址 + 一 键 mod 307+1 


键 
151564 






散 列 函数 


图 13-13 ” 桶 散 列 解决 方案 
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(4) 组 合 方法 
有 很 多 方法 可 以 用 来 解决 冲突 。 正 如 散 列 方法 一 样 ， 复 杂 的 实现 方法 通常 是 组 合 使 用 多 
种 方法 。 


13.5 目录 


目录 是 大 多 数 操作 系统 提供 的 ， 用 来 组 织 文件 。 目 录 完 成 的 功能 就 像 是 档案 柜 中 的 文 
件 夹 一 样 。 但 是 ， 在 大 多 数 操作 系统 中 ， 目 录 被 表示 为 含有 其 他 文件 信息 的 一 种 特殊 文件 类 
型 。 目 录 的 作用 不 仅仅 像 一 种 索引 文件 ， 该 索引 文件 告诉 操作 系统 文件 在 辅助 存储 设备 上 的 
位 置 ， 目 录 还 包含 了 关于 它 所 包含 的 文件 的 其 他 信息 ， 如 : 谁 有 访问 文件 的 权限 ， 文 件 被 创 
建 、 存 取 和 修改 的 日 期 。 

在 大 多 操作 系统 中 ， 目 录 被 组 织 成 像 树 的 抽象 数据 类 型 (ADT)， 这 种 抽象 数据 类 型 在 
第 12 章 中 讨论 过 ， 其 中 除根 目录 外 每 个 目录 都 有 双亲 。 包 含 在 另 一 个 目录 中 的 目录 称 为 包 
含 目 录 的 子 目 录 。 


UNIX 操作 系统 中 的 目录 


在 UNIX 中， 目录 系统 的 组 织 如 图 13-14 所 示 。 
在 目录 结构 的 顶部 是 一 个 称 为 根 的 目录 。 虽 然 它 的 名 字 是 根 ， 但 在 与 目录 有 关 的 命令 
中 ， 它 被 输入 为 正 斜 杠 (/)。 每 个 目录 可 以 包含 子 目 录 和 文件 。 
图 例 


四 





\/ 六根 





图 13-14 UNIX 目录 系统 的 一 个 例子 


1. 特殊 目录 

在 UNIX 中 有 4 种 在 目录 结构 中 起 着 非常 重要 作用 的 特殊 目录 类 型 : 根 目录 、 主 目录 、 
工作 目录 和 父 目 录 。 

(1) 根 目录 

根 目录 是 文件 系统 层次 结构 的 最 高 层 。 它 是 整个 文件 结构 的 根 ， 因 此 它 没 有 父 目 录 。 在 
UNIX 的 环境 中 ， 根 目录 总 是 有 几 层 子 目 录 。 根 目录 属于 系统 管理 员 ， 只 有 系统 管理 员 能 修改 它 。 
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(2) 主 目录 

当 首 次 登录 到 系统 中 ， 我 们 使 用 我 们 的 主 目录 。 这 个 目录 包含 我 们 在 其 中 创建 的 任何 文 
件 ， 还 可 能 包含 个 人 系统 文件 。 主 目录 也 是 个 人 目录 结构 的 开始 。 每 个 用 户 都 有 一 个 主 目录 。 

(3 ) 工作 目录 

工作 目录 (或 当前 目录 ) 是 在 用 户 会 话 中 在 任意 点 我 们 所 “在 ”的 目录 。 当 首次 登录 后 ， 
工作 目录 就 是 我 们 的 主 目录 ， 如 果 有 子 目录 ， 在 会 话 中 ， 当 需要 时 我 们 总 是 喜欢 从 主 目录 移 
到 一 个 或 多 个 子 目 录 中 。 当 我 们 改变 了 目录 ， 我 们 的 工作 目录 也 自动 地 改变 了 。 

(4) 父 目 录 . 

父 目录 是 工作 目录 的 直接 上 层 目 录 。 当 我 们 在 我 们 的 主 目录 中 时 ， 它 的 父 目录 就 是 系统 
目录 中 的 一 个 。 

2. 路 径 和 路 径 名 

文件 系统 的 每 个 目录 和 文件 都 必须 有 一 个 名 字 。 如 果 我 们 仔细 检查 图 13-14， 我 们 将 注 
意 到 有 些 文件 与 其 他 目录 中 的 文件 具有 相同 的 名 字 。 因 此 ， 很 显然 为 了 标识 它们 ， 我 们 需要 
用 比 文件 名 多 的 东西 。 因 此 ， 为 了 唯一 地 标识 一 个 文件 ， 我 们 需要 指明 从 根 目录 到 文件 的 文 
件 路 径 。 文 件 路 径 由 它 的 绝对 路 径 名 来 指明 ， 它 是 斜 线 字符 (/) 分 隔 的 所 有 目录 的 列表 。 

一 个 文件 或 目录 的 绝对 路 径 名 就 像 一 个 人 的 地 址 。 如 果 我 们 仅 知道 人 的 名 字 ， 并 不 容 
易 找 到 这 个 人 。 另 一 方面 ， 如 果 我 们 知道 人 的 名 字 、 街 地 址 、 城 市 、 州 和 国家 ， 那 么 我 们 能 
在 世界 上 找到 任何 人 。 这 个 完全 或 绝对 的 路 径 名 可 能 会 很 长 。 由 于 这 个 原因 ，UNIX 提供 了 
在 特定 情况 下 的 短路 径 名 ， 这 就 是 众所周知 的 相对 路 径 名 ， 它 是 相对 于 工作 目录 的 路 径 。 例 
如 ， 在 图 13-14 中 ， 如 果 我 们 的 工作 目录 是 staff，joan 目录 下 的 file3 可 以 通过 相对 和 绝对 
路 径 名 被 选择 : 

相对 路 径 名 : joan/file3 

绝对 路 径 名 : /usr/staff/joan/file3 


13.6 文本 文件 与 二 进 制 文件 


在 结束 这 章 之 前 ， 我 们 讨论 两 个 用 于 文件 分 类 的 术语 : 文本 文件 和 二 进 制 文件 。 存 储 在 
存储 设备 上 的 文件 是 一 个 位 的 序列 ， 可 被 应 用 程序 翻译 成 一 个 文本 文件 或 是 二 进 制 文件 , 如 
图 13-15 所 示 。 


解释 为 文本 文件 解释 为 二 进 制 文件 


2 字 节 表示 2 个 字符 ( A 和 B ) 2 字 节 表示 1 个 数字 ( 16706 ) 
图 13-15 文件 的 文本 和 二 进 制 解释 





13.6.1 文本 文件 


文本 文件 是 一 个 字符 文件 。 在 它们 的 内 存储 器 格式 中 不 能 包含 整数 、 浮 点 数 或 其 他 数据 
结构 。 要 存储 这 些 类 型 的 数据 ， 必 须 把 它们 转换 成 对 应 的 字符 格式 。 

一 些 文件 只 能 用 字符 数据 格式 。 值 得 注意 的 是 用 于 键盘 、 监 视 器 和 打印 机 的 文件 流 ( 像 
C++ 面向 对 象 语言 中 的 输入 /输出 对 象 )。 这 也 是 为 什么 需要 特殊 的 函数 来 格式 化 上 述 设备 
的 输入 或 输出 数据 。 
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让 我 们 来 看 这 样 一 个 例子 ， 当 数据 (文件 流 ) 传 给 打印 机 时 ， 打 印 机 获得 8 位 数据 ， 解 
释 成 1 字 节 。 将 其 译 码 成 打印 机 的 编码 系统 (ASCII 或 EBCDIC)， 如 果 字 符 属 于 可 打印 的 种 
类 ， 它 将 被 打印 ; 否则 ， 将 执行 另外 的 操作 ， 如 打印 空白 。 然 后 ， 打 印 机 将 读 取 下 一 个 8 位 
数据 ， 依 次 重复 该 过 程 直到 数据 流 结束 。 


13.6.2 二进制 文件 


二 进 制 文件 是 计算 机 的 内 部 格式 存储 的 数据 集合 ， 在 这 种 定义 中 ， 数 据 可 以 是 整 型 ( 包 
括 其 他 表示 成 无 符号 整数 的 数据 类 型 ， 例 如 图 像 、 音 频 或 视频 )、 浮 点 型 或 其 他 数据 结构 〈 除 
了 文件 )。 

不 像 文 本 文件 ， 二 进 制 文件 中 的 数据 只 有 当 被 程序 正确 地 解释 时 才 有 意义 。 如 果 数 据 是 
文本 格式 的 ， 就 用 一 个 字 节 来 表示 一 个 字符 。 如 果 数 据 是 数字 格式 的 ， 则 用 两 个 或 是 更 多 字 
节 来 表示 一 个 数据 项 。 例 如 ,假如 个 人 计算 机 要 用 2 字 节 来 存储 一 个 整数 。 当 读 写 整数 时 ， 
计算 机 就 用 2 字 节 来 表示 。 


13.7 章 末 材料 
推荐 读物 

有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 

® Forouzan, B. and Gilberg, R. Computer Science: A Structured Programming Approach 
Using C, Boston, MA: Course Technology, 2007 
Forouzan, B. and Gilberg, R. UNIX and Shell Programming, Pacific Grove, CA: Brooks/ 
Cole, 2003 


Gilberg, R. and Forouzan, B. Data Structure - A Pseudocode Approach with C, Boston, 
MA: Course Technology, 2005 


小 结 


文件 是 作为 一 个 单元 看 待 的 相关 数据 的 外 部 集合 。 文 件 的 主要 目的 是 存储 数据 。 因 
为 当 计 算 机 关机 后 ， 主 存 的 内 容 将 丢失 ， 所 以 我 们 需要 文件 用 更 持久 的 形式 存储 数 
据 。 文 件 被 存储 在 辅助 或 二 级 存储 设备 上 。 

存 取 的 方法 决定 了 记录 如 何 被 检索 : 顺序 的 或 随机 的 。 如 果 需 要 顺序 地 存 取 文 件 ， 
那么 使 用 顺序 文件 结构 ; 如 果 需 要 存 取 一 指定 的 记录 而 无 需 检 索 出 该 记录 前 的 所 有 
记录 ， 那 么 使 用 随机 文件 结构 。 

顺序 文件 是 一 种 在 其 中 每 个 数据 必须 按 顺 序 从 头 到 尾 一 个 接 一 个 地 进行 存 取 的 文件 。 
顺序 文件 必须 周期 性 地 更 新 ， 以 反映 出 信息 的 变化 。 与 更 新 程序 相关 联 的 文件 有 4 
个 : 新 主 文件 、 旧 主 文 件 、 事 务 文件 和 错误 报告 文件 。 

为 了 在 文件 中 随机 存 取 记 录 ， 我 们 需要 知道 记录 的 地 址 。 通 常 有 两 种 文件 类 型 用 于 
随机 存 取 记录 : 索引 文件 和 散 列 文件 。 

索引 文件 由 数据 文件 构成 ， 该 数据 文件 是 顺序 文件 且 是 一 个 索引 。 索 引 本 身 是 一 个 
只 有 两 个 域 的 非常 小 的 文件 ， 两 个 域 是 顺序 文件 的 键 和 磁盘 上 相应 记录 的 地 址 。 索 
引 是 根据 数据 文件 的 键 值 排序 的 。 在 散 列 文件 中 ， 散 列 函 数 将 键 映射 成 记录 地 址 。 
散 列 可 以 采用 多 种 方法 。 在 直接 方法 中 ， 键 就 是 地 址 ， 不 需要 任何 的 算法 操作 。 在 
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求 模 法 中 ， 键 被 文件 的 大 小 除 ， 得 到 的 余数 加 上 1 就 是 地 址 。 在 数字 析 取 散 列 法 中 ， 
选择 的 数字 是 从 键 中 被 析 取 出 来 的 ， 用 作 地 址 。 

。 在 散 列 过 程 中 ， 有 可 能 会 出 现 多 个 键 值 散 列 至 文件 中 的 相同 地 址 ， 这 样 就 产生 了 冲 
突 。 我 们 讨论 了 几 种 冲突 解决 方法 : 开放 寻 址 解决 法 、 链 表 解 决 法 和 桶 散 列 法 。 

e 目录 是 大 多 数 操作 系统 都 提供 的 用 来 组 织 文件 的 。 目 录 的 作用 就 像 文 件 柜 中 的 文件 
夹 。 但是， 在 大 多 数 操作 系统 中 的 目录 被 表示 成 为 一 个 包含 关于 其 他 文件 的 信息 的 
特殊 文件 类 型 。 

。 存储 在 存储 设备 中 的 文件 是 一 个 二 进 制 位 的 序列 ， 它 可 以 被 应 用 程序 翻译 成 文本 文 
件 或 二 进 制 文件 。 文 本 文件 是 字符 的 文件 。 二 进 制 文件 是 使 用 计算 机 内 部 格式 存储 
的 数据 集合 。 


13.8 练习 
小 测验 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 继续 本 章 习题 前 首先 
完成 相关 测验 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 通常 文件 有 哪 两 种 存 取 方式 ? 

2. 新 主 文件 和 旧 主 文件 之 间 是 什么 关系 ? 

3. 在 顺序 文件 更 新 时 ， 事 务 文件 的 作用 是 什么 ? 

4. 描述 随机 文件 存 取 的 地 址 函数 。 

5. 在 索引 文件 中 ， 索 引 是 如 何 关联 数据 文件 的 ? 

6. 在 文件 直接 散 列 法 中 键 和 地 址 之 间 是 什么 关系 ? 

7. 在 文件 除 余 散 列 法 中 键 和 地 址 之 间 是 什么 关系 ? 

8. 在 文件 数字 析 取 散 列 法 中 键 和 地 址 之 间 是 什么 关系 ? 
9. 给 出 三 种 解决 冲突 的 方法 。 

10. 文本 文件 和 二 进 制 文件 之 间 的 区 别 是 什么 ? 


练习 题 
1. 图 13-16 给 出 了 旧 主 文件 和 事务 文件 ， 找 出 新 主 文件 。 如 果 有 错误 ， 创 建 错误 报告 文件 。 
旧 主 文件 


Name Pay rate Pay rate 


1 | Martha Kent | 17, 


ov 
se 


| 
QQ 
了 


3 
由 辐 E 





| 17.00 
| 
| 28.00 | 
[| 
| 2000 | 





| 14 
| 16 | 
DT 
| 20 | 
26 
31 
| 45 
| 9 
| 92 | 


名 


etsy Yellow 


图 13-16 练习 题 1 
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2. 为 表 13-1 创建 索引 文件 。 
表 13-1 练习 题 2 


3. 一 个 文件 使 用 求 模 法 ， 且 除数 为 41， 下 列 键 的 地 址 分 别 为 多 少 ? 

a. 14232 b. 12560 c. 13450 d. 15341 

4. 在 平方 中 值 散 列 法 中 ， 键 首先 平方 ， 然 后 取 结 果 的 中 间 值 作为 地 址 。 用 这 种 方法 从 下 列 键 中 选择 地 
址 ， 用 数字 3、4 (从 左边 )。 

a. 142 b. 125 c. 134 d. 153 

5. 在 折 春 移 位 散 列 法 中 ， 键 被 分 成 几 部 分 ， 几 部 分 相 加 后 得 到 地 址 。 用 这 种 方法 从 下 列 键 中 找 出 地 址 。 
划分 键 为 两 位 数字 部 分 ， 再 把 它们 相 加 得 到 地 址 。 

a. 1422 b. 1257 c. 1349 d. 1532 

6. 在 折 释 边界 散 列 法 中 ， 键 将 被 划分 ， 左边 和 右边 将 被 倒转 并 加 到 地 址 的 中 间 部 分 去 得 到 地 址 。 用 这 
种 方法 从 下 列 键 中 找 出 地 址 。 划 分 键 为 两 位 数字 部 分 ， 倒 转 第 一 和 第 三 部 分 再 将 它们 加 起 来 获得 
地 址 。 

a. 142234 b. 125711 c. 134914 d. 153213 

7. 用 求 模 法 从 下 列 键 中 找到 地 址 ， 文 件 大 小 为 411， 如 果 有 冲突 ， 用 开放 寻 址 来 解决 。 画 一 个 图 给 出 
记录 的 位 置 。 

a. 10278 b. 08222 c. 20553 d. 17256 

8. 用 链表 解决 法 在 把 第 7 题 重 做 一 遍 。 

9. 文 件 处 理 中 的 一 个 常见 算法 是 合并 两 个 按键 值 排序 的 顺序 文件 ， 产 生 一 个 新 的 顺序 文件 ， 也 是 按键 
值 排 序 的 。 如 果 每 个 文件 在 结尾 处 都 有 一 个 虚拟 的 记录 ， 该 虚拟 记录 具有 比 文件 中 任何 键 值 都 大 的 
唯一 的 键 值 ， 那 么 合并 算法 可 以 变 得 非常 简单 。 这 唯一 的 键 值 被 称 为 哨兵 。 在 这 假想 的 情况 下 ， 就 
没有 必要 去 检查 文件 的 EOF 标识 。 画 出 在 这 种 情况 下 合并 两 文件 的 UML 图 。 

10. 用 伪 码 写 出 练习 题 9 的 算法 。 

11. 如 果 两 个 文件 有 练习 题 9 所 讨论 的 哨兵 值 ， 画 出 基于 事务 文件 更 新 一 个 顺序 文件 的 UML 图。 

12. 用 伪 码 写 出 练习 题 11 的 算法 。 

13. 如 果 在 处 理 过 程 中 我 们 能 人 工 建立 哨兵 ， 那 么 练习 题 9 中 假想 的 情况 就 可 以 被 应 用 到 真实 的 情况 中 
(文件 带 有 一 个 EOF 标识 ) 。 画 出 合并 两 个 带 有 EOF 标识 而 不 是 哨兵 的 顺序 文件 的 UML 图 。 

14. 用 伪 码 写 出 练习 题 13 的 算法 。 

15. 如 果 两 个 文件 使 用 EOF 标识 而 不 是 哨兵 ， 画 出 基于 事务 文件 更 新 顺序 文件 的 UML 图 。 使 用 练习 
题 13 中 的 概念 。 

16. 用 伪 码 写 出 练习 题 15 的 算法 。 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通 过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨论 材料 的 理解 。 





| 第 14 章 


Foundations of Computer Science, Third Edition 


数 据 库 





在 本 章 ， 我 们 讨论 数据 库 和 数据 库 管理 系统 (DBMS)。 我 们 给 出 数据 库 管 理 系统 的 三 
层 结构 。 重 点 讲解 关系 数据 库 模 型 并 举例 说 明 其 运算 。 接 着 ， 介 绍 一 种 在 关系 数据 库 上 使 用 
的 语言 (结构 化 查询 语言 )。 最 后 ， 简 要 介绍 数据 库 设计 和 其 他 的 数据 库 模 型 。 

目标 
通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

说 明 数 据 库 和 数据 库 管理 系统 (DBMS)， 并 描述 DBMS 的 组 成 ; 
描述 基于 ANSI/SPARC 定义 的 DBMS 的 体系 结构 ; 

说 明 三 种 传统 的 数据 库 模型 : 层次、 网络 和 关系 ; 
描述 关系 模型 和 关系 ; 

理解 关系 数据 库 中 的 操作 ， 这 些 操作 在 SQL 中 有 相应 的 命令 ; 
描述 数据 库 设 计 的 步骤 ; 

说 明 ERM 和 E-R 图 ， 解释 这 种 模型 中 的 实体 和 关系 ; 

说 明正 规 化 的 层次 和 理解 正则 关系 的 基本 原理 ; 

列 出 除 关 系 模型 外 其 他 的 数据 库 类 型 。 


14.1 引言 


数据 的 存储 传统 上 是 使 用 单独 的 没有 关联 的 文件 ， 有 时 称 为 平面 文件 。 在 过 去 ,组 织 中 
的 每 个 应 用 程序 都 使 用 自己 的 文件 。 例如， 在 一 所 大 学 中 ， 每 个 部 门 可 能 会 有 他 们 自己 的 文 
件 集合 ， 成 绩 记 录 办 公 室 保存 了 关于 学 生 信息 和 他 们 成 绩 的 文件 ; 经 济 资助 办 公 室 保存 了 他 
们 自己 的 关于 需要 经 济 资助 完成 学 业 的 学 生 的 文件 ; 调度 办 公 室 保 存 了 教授 的 姓名 和 他 们 所 
教 的 课程 ; 工资 部 门 保存 了 他 们 自己 的 关于 全 体 教 职 工 (包括 教授 ) 的 文件 ， 等 等 。 但 是 ， 
现在 所 有 这 些 平面 文件 被 组 合成 一 个 实体 一 一 一 个 全 大 学 的 数据 库 。 


14.1.1 定义 
虽然 要 给 出 一 个 广泛 接受 的 数据 库 定 义 有 一 些 困 难 ， 但 我 们 使 用 下 面 通常 的 定义 : 





14.1.2 ”数据 库 的 优点 


与 平面 文件 系统 相 比 ， 我 们 可 以 说 出 数据 库 系 统 的 几 个 优点 : 

1. 元 余 较 少 

平面 文件 系统 中 存在 着 大 量 的 宛 余 ， 例 如 ， 在 关于 大 学 的 一 个 平面 文件 系统 中 ， 教 授 和 
学 生 的 名 字 就 存在 多 个 文件 中 。 

2. 避免 不 一 致 性 

如 果 相 同 的 信息 被 存储 在 多 个 地 方 ， 那 么 对 数据 的 任何 修改 需要 在 数据 存储 的 所 有 地 方 
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进行 。 例 如 ， 一 个 女 学 生 结婚 了 ， 并 接受 了 她 丈夫 的 姓 ， 那 么 这 个 学 生 的 姓 需要 在 所 有 包含 
该 学 生 信息 的 地 方 做 修改 。 一 不 小 心 很 容易 造成 数据 的 不 一 致 性 。 
3. 效率 
数据 库 通常 比 平面 文件 系统 的 效率 要 高 得 多 ， 因 为 数据 库 中 一 条 信息 存储 在 更 少 的 地 方 。 
4. 数据 完整 性 
数据 库 系统 更 容易 维护 数据 的 完整 性 (参见 第 16 章 )， 因 为 数据 信息 存储 在 更 少 的 地 方 。 
5. 机 密 性 
如 果 数 据 是 集中 存放 在 一 个 地 方 ， 这 就 更 容易 维护 信息 的 机 密 性 。 


14.1.3 ”数据 库 管 理 系统 


数据 库 管理 系统 ( DBMS) 是 定义 、 创 建 、 维 护 数据 库 的 一 种 工具 。DBMS 也 允许 用 户 
来 控制 数据 库 中 数据 的 存 取 。 数 据 库 管 理 
系统 由 5 部 分 构成 : 硬件 、 软 件 、 数 据 、 
用 户 和 规程 (图 14-1)。 

1. 硬件 

硬件 是 指 允 许 物理 上 存 取 数 据 的 计 图 14-1 DBMS 组 成 
算 机 硬件 系统 。 例 如 ， 用 户 终端 、 硬 盘 、 主 机 和 工作 站 ， 都 被 认为 是 DBMS 的 硬件 组 成 
部 分 。 

2. 软件 

软件 是 指 允许 用 户 存 取 、 维 护 和 更 新 物理 数据 的 实际 程序 。 另 外 ， 软 件 工具 还 可 以 控制 
哪些 用 户 可 以 对 数据 库 中 的 哪 部 分 数据 进行 存 取 。 

3. 数据 

数据 库 中 的 数据 存储 在 物理 存储 设备 上 。 数 据 是 独立 于 软件 的 一 个 实体 。 这 种 独立 使 得 
组 织 可 以 在 不 改变 物理 数据 及 其 存 取 方式 的 情况 下 ， 更换 所 应 用 的 软件 。 如 果 组 织 决 定 使 用 
数据 库 管理 系统 ， 那 么 该 组 织 所 需要 的 所 有 信息 必须 存放 在 一 个 实体 中 ， 从 而 便于 DBMS 
中 的 软件 存 取 。 

4. 用 户 

术语 用 户 在 数据 库 管理 系统 中 有 广泛 的 定义 。 我 们 可 以 将 用 户 分 为 两 类 : 最 终 用 户 和 应 
用 程序 。 

(1 ) 最 终 用 户 

最 终 用 户 指 直接 从 数据 库 中 获取 信息 的 用 户 。 最 终 用户 又 可 分 为 两 类 : 数据 库 管理 员 
(DBA) 和 普通 用 户 。 数 据 库 管理 员 拥 有 最 大 的 权限 ， 可 以 控制 其 他 用 户 以 及 他 们 对 数据 库 
的 存 取 。 数 据 库 管理 员 可 以 将 他 的 一 些 特权 授予 其 他 用 户 并 保留 随时 收回 特权 的 能 力 。 而 另 
一 方面 ， 普 通用 户 只 能 使 用 部 分 数据 库 和 有 限 的 存 取 。 

(2 ) 应 用 程序 

数据 库 中 数据 的 其 他 使 用 者 就 是 应 用 程序 。 应 用 程序 需要 存 取 和 处 理 数据 。 例 如 ， 工 资 
单 应 用 程序 就 要 存 取 数据 库 中 的 数据 来 产生 月 底 的 工资 单 。 

5. 规程 

数据 库 管 理 系统 的 最 后 一 个 部 分 就 是 必须 被 明确 定义 并 为 数据 库 用 户 所 遵循 的 规程 或 规 
则 的 集合 。 
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14.2 ”数据 库 体 系 结构 

美国 国家 标准 协会 /标准 计划 和 需求 委员 会 (ANSLSPARC ) 为 数据 库 管 理 系 统 建立 了 
三 层 体系 结构 : 内 层 、 概 念 层 和 外 层 (图 14-2 ) 。 
14.2.1 内 层 


内 层 决 定 了 数据 在 存储 设备 中 的 实际 位 置 。 这 个 层 
次 处 理 低 层次 的 数据 存 取 方 法 和 如 何在 存储 设备 间 传 输 字 
节 。 换 名 话说， 内 层 直接 与 硬件 交互 。 


14.2.2 ”概念 层 


概念 层 定义 数据 的 逻辑 视图 。 在 该 层 中 定义 了 数据 
模式 。 数 据 库 管理 系统 的 主要 功能 (如 查询 ) 都 在 该 层 。 
数据 库 管理 系统 把 数据 内 部 视图 转化 为 用 户 所 看 到 的 外 , 
部 视图 。 概 念 层 是 中 介 层 ， 它 使 得 用 户 不 必 与 内 层 打 图 14-2 数据库 体 系 结构 
交道 。 
14.2.3 ”外 层 

外 层 直 接 与 用 户 (最终 用 户 或 应 用 程序 ) 交互 。 它 将 来 自 概念 层 的 数据 转化 为 用 户 所 熟 
悉 的 格式 和 视图 。 
14.3 数据库 模型 


数据 库 模 型 定义 了 数据 的 逻辑 设计 ， 它 也 描述 了 不 同 数据 之 间 的 联系 。 在 数据 库 设 计 发 
展 史 中 ， 曾 使 用 过 三 种 数据 库 模 型 : 层次 模型 、 网 状 模型 和 关系 模型 。 


14.3.1 层次 模型 


层次 模型 中 ， 数 据 被 组 织 成 一 棵 倒置 的 树 。 每 一 个 实体 可 以 有 不 同 的 子 节点 ， 但 只 能 有 
一 个 双亲 。 层 次 的 最 顶端 有 一 个 实体 ， 称 为 根 。 图 14-3 给 出 了 层次 模型 的 逻辑 视图 。 由 于 
层次 模型 已 经 过 时 ， 我 们 不 再 做 过 多 的 叙述 。 





| No. | Name 






课程 


教授 [全 | Name | 
图 14-3 层次 模型 


L D | Name |Courses) 


学 生 





14.3.2 ”网 状 模型 


网 状 模型 中 ， 实 体 通过 图 来 组 织 ， 图 中 的 部 分 实体 可 通过 多 条 路 径 来 访问 (图 14-4 )。 
这 里 没有 层次 关系 。 由 于 该 模型 已 经 过 时 ， 我们 也 不 再 做 过 多 的 描述 。 
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14-4 ”网 状 模型 


14.3.3 ”关系 模型 


关系 模型 中 ， 数 据 组 织 成 称 为 关系 的 二 维 表 ， 这 里 没有 任何 层次 或 网 络 结构 强加 于 数据 
上 ， 但 表 或 关系 相互 关联 ， 如 图 14-5 所 示 。 
Name Dept-No Courses 





学 生 


ID Name Courses 


图 14-5 ”描述 大 学 的 关系 模型 示例 


今天 ， 关系 模型 是 数据 库 设 计 中 最 常用 的 模型 。 我 们 将 在 本 章 中 花费 大 部 分 篇 幅 去 介绍 
它 。 在 14.7 节 ， 将 简要 地 介绍 另外 两 种 常用 的 、 派 生 于 关系 模型 的 数据 库 模 型 : 分布 式 模 
型 和 面向 对 象 模型 。 


14.4 关系 数据 库 模型 
在 关系 数据 库 管 理 系统 (ROBMS) 中 ， 数 据 是 通过 关系 的 集合 来 表示 的 。 


关系 


从 表面 上 看 ， 关 系 就 是 二 维 表 。 在 关系 数据 库 管 
理 系 统 中 ， 数 据 的 外 部 视图 就 是 关系 或 表 的 集合 ,但 
这 并 不 代表 数据 以 表 的 形式 存储 。 数 据 的 物理 存储 与 ne 
数据 的 逻辑 组 织 的 方式 毫 无 关系 。 图 14-6 给 出 了 一 | GIS1S mao 5 
个 关系 的 例子 。 
关系 数据 库 管 理 系统 中 的 关系 有 下 列 特 征 : 
e 名 称 : 在 关系 数据 库 管理 系统 中 ， 每 一 种 关 
系 具 有 唯一 的 名 称 。 图 14-6 关系 的 示例 


No Dept-No Prof-ID Unit 
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。 属性 : 关系 中 的 每 一 列 都 称 为 属性 ， 属 性 在 表 中 是 列 的 头 (图 14-6 )。 每 一 个 属性 表 
示 了 存储 在 该 列 下 的 数据 的 含义 。 表 中 的 每 一 列 在 关系 范围 内 有 唯一 的 名 称 。 关 系 
中 属性 的 总 数 称 为 关系 的 度 。 图 14-6 中 的 关系 的 度 为 3， 注 意 属性 名 并 不 存储 在 数 
据 库 中 ， 概 念 层 中 使 用 属性 给 每 一 列 赋予 一 定 的 意义 。 

e 元 组 : 关系 中 的 行 叫 做 元 组 。 元 组 定义 了 一 组 属性 值 。 关 系 中 元 组 的 个 数 叫做 关系 
的 基数 。 当 增加 或 减少 元 组 时 ， 关 系 的 基数 就 会 改变 。 这 就 实现 了 动态 数据 库 。 


14.5 关系 的 操作 


在 关系 数据 库 中 ， 我 们 可 以 定义 一 些 操作 来 通过 已 知 的 关系 创建 新 的 关系 。 本 节 中 
共 定 义 了 9 种 操作 : 插入、 删除、 更新、 选择、 投影 、 连 接 、 并 、 交 和 差 。 我 们 并 不 抽 
象 地 讨论 这 些 操作 ， 而 是 把 它们 描述 成 在 数据 库 查 询 语言 SQL (结构 化 查询 语言 ) 中 的 
定义 。 


14.5.1 结构 化 查询 语言 


结构 化 查询 语言 (SQL ) 是 美国 国标 协会 (ANSI) 和 国际 标准 组 织 (ISO) 用 于 关系 数据 
库 上 的 标准 化 语言 。 这 是 一 种 描述 性 (不 是 过 程 化 ) 的 语言 ， 这 意味 着 使 用 者 不 需要 一 步 步 
地 编写 详细 的 程序 而 只 需 声明 它 。 结 构 化 查询 语言 于 1979 年 首次 被 Oracle 公司 实现 。 之 后 
有 了 更 多 的 新 版 本 。 


14.5.2 插入 


插入 是 一 元 操作 ， 它 应 用 于 一 个 关系 。 其 作用 是 在 表 中 插入 新 的 元 组 。 插 入 操作 使 用 如 
下 的 格式 : 


insert into RELATION-NAME values {Um ) 


value 子 句 定义 了 要 插入 的 相应 元 组 的 所 有 属性 。 例 如 ， 图 14-7 显示 了 这 个 操作 是 如 何 
被 应 用 于 一 个 关系 的 。 注 意 ， 在 SQL 语言 中 ,字符 串 的 值 是 要 用 引号 括 起 来 的 ， 而 数值 就 
不 需要 。 
课程 

No Course-Name Unit 
IntrotoC 


Intro to Java 
UNIX 


No Course-Name Unit 


Intro'to'C insert into COURSES 
Intro to Java values ("CIS52", "TCP/IP", 6) 


UNIX 
命令 Networking 


Networking 





TCP/IP 
图 14-7 插入 操作 的 一 个 例子 


14.5.3 ”删除 
删除 也 是 一 元 操作 。 根 据 要 求 删 除 表 中 相应 的 元 组 。 删 除 操作 使 用 如 下 格式 : 


delete from RELATION-NAME where criteria 
删除 的 条 件 是 由 where 子 句 定义 的 。 例 如 ， 图 14-8 显示 了 如 何 从 关系 课程 ( COURSE) 
中 删除 一 个 元 组 ， 注 意 条 件 是 No = "CIS19"。 
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No Course-Name Unit 


JIntro to C 
Intro to Java 
UNIX 
Networking 
TCP/IP 


14.5.4 更 新 


delete from COURSES 
where No= "ClS19" 


命令 





图 14-8 ”删除 操作 的 一 个 例子 
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(@IolV IINE Ul ll 
Intro to C 

Intro to Java 
Networking 
TCP/IP 


更 新 也 是 一 元 操作 ， 它 应 用 于 一 个 关系 。 用 来 更 新 元 组 中 的 部 分 属性 值 。 更 新 操作 使 用 


如 下 格式 : 


Update RELATION-NAME 


set attributel=valuel, attribute2=value2,*… 


where criteria 


要 改变 的 属性 定义 在 set 子 句 中 ， 更 新 的 条 件 定义 在 where 子 句 中 。 例 如 ， 图 14-9 显示 
了 一 个 元 组 中 的 Unit (属性 ) 的 数目 是 如 何 被 更 新 的 。 


课程 
[Nke) ieWlSeNEUIL 
Jntro to C 
Intro to Java 


UNIX 
Networking 
TCP/IP 


14.5.5 ”选择 


update COURSES 
set Unit= 6 
where No="CIS51" 


命令 





图 14-9 更 新 操作 的 一 个 例子 


Course-Name Unit 
IntrotoC 5 
Intro to Java 
UNIX 
Networking 
TCP/IP 


选择 也 是 一 元 操作 。 它 应 用 于 一 个 关系 并 产生 另外 一 个 新 关系 。 新 关系 中 的 元 组 ( 行 ) 
是 原 关系 元 组 的 子 集 。. 选 择 操作 根据 要 求 从 原 表 中 选择 部 分 元 组 。 选 择 操作 使 用 如 下 格式 : 


select * 
from RELATION-NAME 
where criteria 


星 号 (*) 表示 所 有 的 属性 都 被 选择 。 图 14-10 给 出 了 选择 操作 的 一 个 例子 。 该 图 中 给 
出 了 一 个 小 系 所 提供 的 课程 ， 选 择 操作 允许 用 户 只 选择 含有 5 个 单元 的 课程 。 
课程 
NIe OLIN Ell ll 
JIntro to C 
Intro to Java 


UNIX 
Networking 
TCP/IP 


select* [NIe O70 (SN El 


from COURSES CIS15 | IntrotoC 
where Unit=5 CIS17 | Intro to Java 


CIS51 | Networking 





图 14-10 ”选择 操作 的 一 个 例子 
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14.5.6 ”投影 


投影 也 是 一 元 操作 。 它 应 用 于 一 个 关系 并 产生 另外 一 个 新 关系 。 新 表 中 的 属性 ( 列 ) 是 
原 表 中 属性 的 子 集 。 投 影 操 作 所 得 到 的 新 关系 中 的 元 组 属性 减少 ,但 元 组 〈 行 ) 的 数量 保持 
不 变 。 投 影 操 作 使 用 如 下 的 格式 : 


select attribute-list 
from RELATION-NAME 


新 关系 的 列 名 被 显 式 地 列 出 。 图 14-11 给 出 了 一 个 投影 操作 的 例子 ， 即 产生 仅 两 列 的 一 
个 关系 。 


课程 
No [elILSNELUUL TI 
Intro to C 
Introto Java | 5 select No, Unit 


UNIX from COURSES 
Networking 
TCP/IP 





图 14-11 投影 操作 的 一 个 例子 


14.5.7 ”连接 
连接 是 二 元 操作 。 它 基于 共有 的 属性 把 两 个 关系 组 合 起 来 。 连 接 操 作 使 用 如 下 格式 : 


select attribute-list 
from RELATION]1,RELATION2 
where criteria 


属性 表 是 两 个 输入 关系 的 属性 组 合 。 条 件 明 确 地 定义 了 作为 相同 属性 的 属性 。 连 接 
操作 十 分 复杂 并 有 很 多 变化 。 图 14-12 给 出 了 关系 COURSES 和 关系 TAUGHT-BY 的 连 
接 ， 生 成 了 一 个 信息 更 加 全 面 的 关系 ,包括 了 教授 的 名 字 。 这 里 ， 共 有 的 属性 是 课程 


号 (No)。 


课程 TAUGHT-BY 
No Course-Name Unit No 
Intro to C select No, Course-mame, Unit, Professor 
Intro to Java 5 from COURSES, TAUGHT-BY 
UNIX where COURSE.No=TAUGHT-BY.NO; 
Networking 
TCP/IP 











Professor 











No Course-Name Unit Professor 
IntrotoC 
Intro to Java 
UNIX 
Networking 
TCP/IP 


图 14-12 ”连接 操作 的 一 个 例子 
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14.5.8 并 


并 也 是 二 元 操作 。 它 将 两 个 关系 合并 成 一 个 新 的 关系 。 不 过 这 里 对 两 个 关系 有 一 个 限 
制 ， 即 它们 必须 有 相同 的 属性 。 并 操作 ， 类 似 于 集合 论 中 的 定义 ， 新 关系 中 的 每 一 个 元 组 或 
者 在 第 一 个 关系 、 第 二 个 关系 ， 或 者 在 两 个 关系 中 缘 有 。 并 操作 使 用 如 下 格式 : 


select * 

from RELATION]1 
union 

select * 

from RELATION2 


这 里 星 号 仍然 是 代表 所 有 属性 都 被 选择 。 例 如 ， 图 14-13 给 出 了 两 个 关系 : 左上 是 
CIS15 的 花 名 册 ,， 右上 是 CIS52 的 花 名 册 。 结 果 就 是 一 关系 ， 关 系 中 列 出 了 所 有 包含 在 
CIS15、CIS52 花 名 册 中 ， 或 者 两 个 花 名 册 中 都 有 的 学 生 。 


CIS15-Roster SQI 命 令 CISS2-Roster 












StudentID F-Name LName select* Student-ID  F-Name L-Name 


145-67-6754 | John Brown lromv OlS to- Roster 145-67-6754 | John Brown 
232-56-5690 | George | Yellow - 

345-89-6580| Anne | Green 082.56.5690| Gieorge: | Yellow 
459-98-6789| Ted 342-88-9999 | Rich | White 











459-98-6789 


图 14-13 并 操作 的 一 个 例子 


14.5.9 交 


交 也 是 二 元 操作 。 它 对 两 个 关系 操作 ， 创 建 一 个 新 关系 。 和 并 操作 一 样 ， 进 行 交 操作 的 
两 个 关系 必须 有 相同 的 属性 。 交 操作 ， 类 似 于 集合 论 中 的 定义 ， 新 关系 中 的 每 一 个 元 组 必须 
是 两 个 原 关 系 中 共有 的 成 员 。 交 操作 使 用 如 下 格式 : 


select * 

from RELRATION1 

intersection 

select * 

from RELATION2 

这 里 的 星 号 仍然 是 表示 所 有 的 属性 被 选择 。 例 如 ， 图 14-14 中 的 交 操 作 显 示 了 所 有 的 属 
性 被 选择 。 

例如 ， 图 14-14 给 出 了 两 个 输入 关系 ， 经 过 交 操 作 后 ， 给 出 了 既 在 CIS15 花 名 册 又 在 
CIS52 花 名 册 中 的 学 生 。 


14.5.10 差 
差 也 是 二 元 操作 。 它 应 用 于 具有 相同 属性 的 两 个 关系 。 生 成 的 关系 中 的 元 组 是 那些 存在 
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于 第 一 个 关系 中 而 不 在 第 二 个 关系 中 的 元 组 。 差 操作 使 用 如 下 格式 : 


CIS15-Roster 
命令 CIS52-Roster 


Student-ID F-Name L-Name RE olen lly I Mane Le 
Brown from CIS15-Roster 





































145-67-6754 145-67-6754 | John Brown 








intersection 
Ce eci 232-56-5690 | George | Yellow 
459-98-6789 Purple from CIS52-Roster 342-88-9999 | Rich White 







Student-ID F-Name L-Name 


145-67-6754 John Brown 
232-56-5690 George Yellow 


图 14-14 ” 交 操 作 的 一 个 例子 











select * 

from RELATION1 
minus 

select * 

from RELATION2 


这 里 星 号 仍然 表示 所 有 的 属性 被 选择 。 例 如 ， 图 14-15 给 出 了 两 个 输入 关系 ， 差 操作 的 
结果 为 那些 在 CIS15 花 名 册 而 不 在 CIS52 花 名 册 中 的 学 生 。 


CIS15-Roster 命令 CIS52-Roster 


Student-ID F-Name L-Name welt Student-ID FF-Name L-Name 
ti Ie 145-67-6754 | John Brown 
Go | Eee 232-56-5690 | George | Yellow 

Ee a | 342-88-9999 | Rich | White 































145-67-6754 
232-56-5690 
345-89-6580 
459-98-6789 











Student-ID F-Name L-Name 


345-89-6580 Anne Green 
459-98-6789 Ted Purple 


图 14-15 差 操作 的 一 个 例子 





语句 的 组 合 
SQL 语言 允许 我 们 去 组 合 前 面 介 绍 的 语言 ， 从 数据 库 中 抽取 出 更 复杂 的 信息 。 


14.6 ”数据 库 设计 


数据 库 的 设计 是 一 个 元 长 且 只 能 通过 一 步 步 过 程 来 完成 的 任务 。 第 一 步 通常 涉及 与 数据 
库 潜 在 用 户 的 面谈 (例如 ， 在 一 个 大 学 里 )， 去 收集 需要 存储 的 信息 和 每 个 部 门 的 存 取 和 需求 。 
第 二 步 就 是 建立 一 个 实体 关系 模型 (ERM)， 这 种 模型 定义 了 其 一 些 信息 需要 维护 的 实体 、 
这 些 实体 的 属性 和 实体 间 的 关系 。 

设计 的 下 一 步 是 基于 御用 的 数据 库 类 型 的 。 在 关系 数据 库 中 ， 下 一 步 就 是 建立 基于 
ERM 的 关系 和 规范 化 这 些 关系 。 在 这 门 介绍 性 的 课程 中 ， 我 们 仅仅 给 出 ERM 和 规范 化 的 一 
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14.6.1 实体 关系 模型 


在 这 一 步 ， 数 据 库 设计 者 建立 了 实体 关系 ( E-R) 图 来 表示 那些 其 信息 需要 保存 的 实体 
和 实体 间 的 关系 。E-R 图 使 用 了 多 种 几何 图 形 ， 但 这 里 只 使 用 其 中 的 少 部 分 : 

@ 适 形 表示 实体 集 。 

e 椭圆 形 表示 属性 。 

e 蓉 形 表示 关系 集 。 

e 线 连 接 属性 和 实体 以 及 连接 实体 集 和 关系 集 。 


例 14.1 图 14-16 显示 了 一 个 非常 简单 的 E-R 图 ， 其 中 有 三 个 实体 集 及 其 属性 和 实体 
集 间 的 关系 。 





PROFESSOR 


图 14-16 E-R 图 中 的 实体 、 属 性 和 关系 


关系 (用 菱形 表示 的 ) 可 以 是 一 对 一 、 一 对 多 、 多 对 一 和 多 对 多 。 在 图 14-16 中 ，STU- 
DENT 集合 和 COURSE 集合 间 的 关系 是 一 个 一 对 多 的 关系 (在 图 中 用 1-M 来 显示 )， 这 意味 着 
STUDENT 集合 中 的 一 个 学 生 可 以 选修 COURSE 集合 中 的 多 门 课程 。 如 果 我 们 把 选课 的 关系 
改 成 被 选 的 关系 ,那么 STUDENT 集合 和 COURSE 集合 间 的 关系 就 是 一 个 多 对 一 的 关系 。 

图 14-16 中 有 些 属性 被 隐藏 了 。 在 每 个 集合 都 有 被 看 作 该 集合 的 关键 字 的 属性 。 注 意 关 
系 集合 也 可 以 有 实体 的 ， 但 是 为 了 使 讨论 简明 ， 我 们 这 里 的 关系 并 没有 显示 出 属性 。 


14.6.2 ”从 E-R 图 到 关系 


在 E-R 图 完成 后 ， 关 系数 据 库 中 的 关系 就 能 建立 了 。 
1. 实体 集 上 的 关系 


对 于 E-R 图 中 的 每 个 实体 集 ， 我 们 都 创建 一 个 关系 ( 表 )， 这 些 关 系 具有 个 列 ， 对 应 
于 这 个 集合 所 定义 的 个 属性 。 


例 14.2 我 们 可 以 有 三 个 关系 ( 表 )， 分别 对 应 于 图 14-16 中 所 定义 的 实体 集 ， 如 
图 14-17 所 示 。 


COURSE STUDENT PROFESSOR 


No Name Unit S-ID Name [aelolfsEE P-ID Name ee 


图 14-17 对 应 于 图 14-16 中 实体 集 的 关系 
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2. 关系 集 上 的 关系 

对 于 E-R 图 中 的 每 个 关系 集 ， 我 们 都 创建 一 个 关系 ( 表 )， 这 个 关系 中 有 一 个 列 对 应 于 
这 个 关系 所 涉及 的 实体 集 的 关键 字 ， 如 果 关 系 有 属性 (本 例 中 没有 )， 这 个 关系 还 可 以 有 关 
系 本 身 的 属性 对 应 的 列 。 

例 14.3 图 14-16 中 有 两 个 关系 集 teaches 和 takes， 每 一 个 连接 两 个 实体 集 ， 这 些 关系 
集 的 关系 被 加 到 先前 的 实体 集 关 系 中 ， 它 们 在 图 14-18 中 显示 。 


gr PROFESSOR 

NElul nT ee Address P-ID Name Address 
TEACHES TAKES 
P=:IiD No. 





图 14-18 图 14-16 中 的 E-R 图 对 应 的 关系 


14.6.3 ”规范 化 


规范 化 是 一 个 处 理 过 程 ， 通 过 此 过 程 给 定 的 一 组 关系 转化 成 一 组 具有 更 坚固 结构 的 新 关 
系 。 规 范 化 要 允许 数据 库 中 表示 的 任何 关系 ， 要 允许 像 SQL 这 样 的 语言 去 使 用 由 原子 操作 
组 成 的 恢复 操作 ， 要 移 除 插入 、 删 除 和 更 新 操作 中 的 不 规则 ， 要 减少 当 新 的 数据 类 型 被 加 入 
时 对 数据 库 重 建 的 需要 。 

规范 化 过 程 定义 了 一 组 层次 范式 (NF)。 多 种 范式 已 经 被 提出 ， 包 括 INF、2NF、3NF、 
BCNF (Boyce-Codd 范式 ) 4NF .PJNF (Projection/Joint 范式 ) 和 5NF 等 。 这 些 范式 ( 1NF 除外 ) 
的 讨论 涉及 函数 依赖 性 的 讨论 ， 这 是 一 门 理论 的 学 科 ， 超 出 了 本 书 的 范围 ， 这 里 我 们 只 是 从 
兴趣 出 发 简单 地 讨论 其 中 的 一 些 。 但 是 ， 有 一 点 要 知道 ， 那 就 是 这 些 范式 形成 了 一 个 层次 结 
构 ， 换 言 之 ， 如 果 一 个 数据 库 中 的 关系 是 3NF， 那 它 首先 应 该 是 2NF。 

1. 第 一 范式 ( 1NF) 

当 我 们 把 实体 或 关系 转换 成 表格 式 的 关系 时 ， 可 能 有 些 关系 的 行 或 列 的 交集 有 多 个 值 。 
例如 ， 在 图 14-18 的 一 组 关系 中 ， 其 中 有 两 个 关系 teaches 和 takes 就 不 是 第 一 范式 。 一 个 教 
授 可 以 教授 多 门 课 程 ， 而 一 个 学 生 也 可 以 修 多 门 课 程 。 这 两 个 关系 可 以 通过 重复 有 问题 的 行 
来 进行 规范 化 。 

图 14-19 显示 了 关系 teaches 是 如 何 规范 化 的 ， 一 个 不 是 第 一 范式 的 关系 可 能 会 遇 到 许 
多 问题 。 例 如 ， 如 果 ID 为 8256 的 教授 不 再 教授 课程 CIS15， 那 我 们 需要 在 关系 teaches 中 
删除 这 个 教授 记录 的 一 部 分 ， 在 数据 库 系统 中 ， 我 们 总 是 删除 一 整 条 记录 ， 而 不 是 一 条 记录 
的 一 部 分 。 

2. 第 二 范式 ( 2NF) 

在 每 个 关系 中 ， 我 们 需要 有 一 个 关键 字 ( 称 为 主键 )， 所 有 其 他 的 属性 ( 列 值 ) 都 依赖 
于 它 。 例 如 ， 如 果 学 生 的 ID 给 定 后 ， 就 应 该 有 可 能 找到 学 生 的 姓名 。 但 是 ， 当 关系 是 根据 
E-R 图 建立 时 ， 我 们 可 能 有 一 些 复 合 的 关键 字 (两 个 或 两 个 以 上 关键 字 的 组 合 )。 在 这 种 情 
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况 下 ， 如 果 每 一 个 非 关键 字 属 性 都 依赖 于 整个 复合 关键 字 ， 那 么 这 个 关系 就 是 第 二 范式 的 。 
TEACHES 





a) 不 是 第 一 范式 b) 是 第 一 范式 
图 14-19 ”1NF 的 一 个 例子 


如 果 有 些 属性 只 依赖 于 复合 关键 字 的 一 部 分 ， 那 这 个 关系 就 不 是 第 二 范式 的 。 作 为 一 个 
简单 的 例子 ,假设 我 们 有 一 个 关系 ， 有 4 个 属性 ( Student ID ，Course No，Student Grade， 
Student Name)， 其 中 前 两 个 组 成 一 个 复合 关键 字 。 学 生 的 成 绩 是 依赖 于 整个 关键 字 的 ， 但 姓 
名 只 依赖 于 关键 字 的 一 部 分 。 我 们 可 以 应 用 2NF 过 程 ， 把 关系 分 成 都 是 第 二 范式 的 两 部 分 。 


不 是 第 二 范式 


Student ID Course No Grade Student Name 


| 
| 


Student ID Course No Grade Student ID Student Name 


是 第 二 范式 是 第 二 范式 
图 14-20”2NF 的 一 个 例子 


一 个 不 是 第 二 范式 的 关系 也 可 能 遇 到 问题 。 例 如 ， 在 图 14-20 中 ， 如 果 学 生 连 一 门 课 的 
成 绩 都 没有 ， 那 就 不 能 加 到 数据 库 中 。 但 如 果 我 们 有 两 个 关系 ， 学 生 可 以 加 到 第 二 个 关系 中 ， 
当 学 生 修 了 一 门 课 ， 完成， 得 到 成 绩 时 ， 关 于 这 个 学 生 的 信息 就 可 以 加 到 第 一 个 关系 中 。 

3. 其 他 范式 

其 他 范式 使 用 属性 间 更 复杂 的 依赖 关系 。 我 们 把 这 些 依赖 留 给 专门 介绍 数据 库 的 书籍 。 


14.7 ”其 他 数据 库 模 型 


关系 数据 库 并 不 是 当今 唯一 通用 的 数据 库 模型 。 另 两 种 通用 模型 是 : 分 布 式 数据 库 和 面 
向 对 象 数 据 库 。 我 们 这 里 只 简要 地 介绍 这 两 种 模型 。 


分 布 式 数据 库 


分 布 式 数据 库 模 型 实际 上 并 不 是 一 个 新 的 模型 ， 它 是 基于 关系 模型 的 。 只 不 过 ， 数 据 库 
中 的 数据 存储 在 一 些 通过 因特网 (或 一 些 私 有 的 广域网 ) 通信 的 计算 机 上 。 每 台 计 算 机 (或 
者 站 点 ) 拥有 部 分 或 全 部 数据 库 。 换 名 话说， 数据 或 者 是 分 别 存储 在 每 个 站 点 或 者 是 为 每 个 
站 点 所 复制 。 
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1. 不 完全 的 分 布 式 数据 库 

.在 不 完全 的 分 布 式 数据 库 中 ， 数 据 是 本 地 化 的 。 本 地 使 用 的 数据 存储 在 相应 的 站 点 上 。 
但 是 ， 这 并 不 意味 着 一 个 站 点 不 能 访问 存储 在 其 他 站 点 的 数据 。 访 问 大 部 分 情况 下 是 本 地 
的 ， 但 偶尔 又 是 全 局 的 。 虽 然 站 点 对 存储 的 本 地 数据 具有 完全 控制 权 ， 但 是 通过 因特网 或 广 
域 网 ， 还 存在 一 个 全 局 的 控制 。 

例如 ， 一 个 医药 公司 在 许多 城市 拥有 多 个 站 点 ， 每 个 站 点 有 一 个 数据 库 ， 存 储 着 自己 的 
雇员 信息 。 但 是 中 心 人 事 部 门 能 控制 所 有 的 数据 库 。 

2. 复制 式 的 分 布 式 数据 库 

在 复制 式 的 分 布 式 数据 库 中 ， 每 个 站 点 都 有 其 他 站 点 的 一 个 完全 副本 。 对 一 个 站 点 数据 
的 修改 将 会 在 其 他 站 点 的 副本 数据 上 重复 。 这 样 ， 数 据 库 的 安全 性 就 得 到 了 加 强 。 如 果 系 统 
的 一 个 站 点 出 了 问题 ， 用 户 可 访问 其 他 站 点 的 数据 。 

3. 面向 对 象 数 据 库 

关系 数据 库 具有 数据 的 特定 视图 ， 该 视图 基于 该 关系 数据 库 的 本 性 (元 组 和 属性 )。 关 系 
数据 库 中 最 小 的 数据 集合 就 是 一 个 元 组 与 一 个 属性 列 的 交集 。 但 今天 ， 很 多 应 用 程序 要 求 以 
另 一 种 形式 看 竺 数据。 有些 应 用 程序 则 把 数据 看 成 结构 〈 见 第 11 章 )， 例 如 由 域 构 成 的 记录 。 

面向 对 象 数据 库 在 试图 保留 关系 模型 优点 的 同时 允许 应 用 存 取 结 构 化 数据 。 在 面向 对 象 
数据 库 中 ， 定 义 了 对 象 和 它们 的 关系 。 另 外 ， 每 一 个 对 象 可 以 具有 属性 并 以 域 的 形式 表达 。 

例如 在 某 个 组 织 中 ， 可 以 定义 对 象 类 型 ， 如 和 雇员、 部 门 和 客户 。 雇 员 类 可 以 定义 一 个 雇 
员 对 象 的 属性 〈 名 、 姓 、 社 会 保险 号 、 薪 水 等 ) 以 及 如 何 存 取 它 们 。 部 门 对 象 可 以 定义 部 门 
的 属性 以 及 如 何 存 取 它们 。 另 外 ， 数 据 库 还 可 以 建立 雇员 与 部 门 间 的 关系 (一 个 雇员 在 一 个 
部 门 工作 )。 

4. XML 

通常 用 作 面 向 对 象 数 据 的 查询 语言 是 XML (Extensible Markup Language)。 正 如 我 们 在 
第 6 章 中 所 讨论 的 ， 起 初 XML 是 用 来 给 文本 文档 增加 标记 信息 的 ， 但 它 还 应 用 于 数据 库 查 
询 语言 。XML 能 用 嵌 套 结构 表示 数据 。 
14.8 ” 章 末 材料 
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e 数据 库 是 逻辑 上 相关 的 数据 集合 ， 而 不 是 物理 上 的 ， 它 的 各 个 部 分 在 物理 上 是 可 以 
分 开 的 。 数 据 库 管理 系统 (DBMS) 定义 、 创 建 和 维护 数据 库 。 
美国 国家 标准 协会 /标准 计划 和 和 需求 委员 会 (ANSI/SPARC) 建立 了 DBMS 的 三 层 体 
系 结构 : 内 层 、 概 念 层 和 外 层 。 内 层 决定 了 数据 在 存储 设备 上 的 实际 存储 位 置 概 
念 层 定义 了 数据 的 逻辑 视图 ; 外 层 直接 与 用 户 交 互 。 
e 传统 的 三 种 数据 模型 是 : 层次 模型 、 网 状 模型 和 关系 模型 。 只 有 最 后 一 种 关系 模型 
”存活 下 来 。 
e 在 关系 模型 中 ， 数 据 在 一 张 称 为 关系 的 二 维 表 中 组 织 起 来 。 关 系 有 如 下 特性 : 姓名 、 
属性 和 元 组 。 
e 在 一 个 关系 数据 库 中 ， 我 们 能 定义 几 个 操作 ， 根 据 现 有 的 关系 建立 新 的 关系 。 在 结 
构 化 查询 语言 SQL (Structured Query Language) 的 上 下 文中 ,我 们 提 到 了 9 种 操作 : 
插 和 入、 删除、 更新、 选择 、 投 影 、 并 、 交 和 差 。 
e。 数据 库 的 设计 是 一 个 元 长 且 只 能 通过 一 步 步 过 程 来 完成 的 任务 。 第 一 步 通常 涉及 与 
数据 库 潜在 用 户 的 面谈 ， 去 收集 需要 存储 的 信息 和 每 个 部 门 的 存 取 和 需求。 第 二 步 就 
是 建立 一 个 实体 关系 模型 (ERM)， 这 种 模型 定义 了 一 些 信息 需要 维护 的 实体 。 下 一 
步 就 是 建立 基于 ERM 的 关系 。 
e 规范 化 是 一 个 处 理 过 程 ， 通 过 此 过 程 给 定 的 一 组 关系 转化 成 一 组 具有 更 坚固 结构 的 
新 关系 。 规 范 化 要 允许 数据 库 中 表示 的 任何 关系 ， 要 允许 像 SQL 这 样 的 语言 去 使 用 
由 原子 操作 组 成 的 恢复 操作 ， 要 移 除 插入 、 删 除 和 更 新 操作 中 的 不 规则 ， 要 减少 当 
新 的 数据 类 型 被 加 入 时 对 数据 库 重建 的 需要 。 
e 关系 数据 库 不 是 当今 唯一 的 数据 模型 ， 两 个 其 他 常见 模型 是 分 布 式 数据 库 和 面向 对 
象 数据 库 。 


14.9 练习 
小 测验 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 继续 本 章 习题 前 首先 
完成 相关 测验 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 数据 库 管理 系统 的 5 个 必要 的 组 成 部 分 是 什么 ? 

2. 数据 库 有 哪 三 种 数据 库 模 型 ? 哪 种 是 目前 流行 的 ? 

3. 什么 叫 关系 数据 库 中 的 关系 ? 

4. 在 一 个 关系 中 ， 什 么 称 为 属性 ? 什么 称 为 元 组 ? 

5. 列 出 关系 数据 库 中 的 一 些 一 元 操作 。 

6. 列 出 关系 数据 库 中 的 一 些 二 元 操作 。 

7. 什 么 是 SQL? 什么 是 XML ? 哪 一 个 是 关系 数据 库 的 查询 语言 ? 哪 一 个 是 面向 对 象 数 据 库 的 查询 


语言 ? 
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练习 题 
图 14-21 应 用 于 练习 题 1 ~ 5。 
1. 有 如 图 14-21 所 示 的 关系 A、B、C。 写 出 下 2 B1 B2 
列 SQL 语句 的 结果 。 
select * 
from A 





where A2=16 


.有 如 图 14-21 所 示 的 关系 A、B、C。 写 出 下 
列 SQL 语句 的 结果 。 
select Al A2 


from A 
where A2=16 


.有 如 图 14-21 所 示 的 关系 A、B、C。 写 出 下 列 SQL 语句 的 结果 。 


select A3 
from A 


4. 有 如 图 14-21 所 示 的 关系 A、B、C。 写 出 下 列 SQL 语句 的 结果 。 


select Bl 
from B 
where B2=216 


.有 如 图 14-21 所 示 的 关系 A、B、C。 写 出 下 列 SQL 语句 的 结果 。 


update C 
set Cl=37 
where Cl=31 
6. 用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 仅 含 有 课程 号 和 每 门 课程 单元 的 数目 的 关系 。 
7. 用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 仅 含 有 学 生 ID 和 姓名 的 关系 。 
8. 用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 仅 含 有 教授 姓名 的 关系 。 
9. 用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 仅 含 有 系 名 称 的 关系 。 
10. 用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 ID=2010 的 学 生 所 上 课程 的 关系 。 
11. 用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 Blake 教授 所 教 课程 的 关系 。 
12. 用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 包含 UNITS=3 的 课程 的 关系 。 
13. 用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 仅 包含 选 学 了 课程 CIS015 的 学 生 姓 名 的 关系 。 
14. 用 图 14-5 中 的 模型 ， 利 用 SQL 语句 生成 一 个 包含 计算 机 科学 系 的 系 号 的 关系 。 
15. 下 面 的 关系 是 属于 第 一 范式 (1NF) 吗 ? 如 果 不 是 ， 修 改 该 表 使 它 符合 1NF 的 标准 。 


图 14-21 练习 题 1 ~ 5 的 关系 


tb 


LO 


(LA 





16. 为 一 公共 图 书馆 创建 E-R 图 ， 并 显示 能 从 这 个 图 中 创建 的 关系 略图 。 

17. 为 一 房地产 公司 创建 E-R 图 ， 并 显示 能 从 这 个 图 中 创建 的 关系 略图 。 

18. 为 一 个 航空 公司 的 三 个 实体 FLIGHT、AIRCRAFT 和 PILOT 建立 一 个 E-R 图 ， 并 显示 这 个 公司 的 
关系 略图 。 
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19. 使 用 参考 资料 或 因特网 查找 关于 第 三 范式 (3NF) 的 资料 ， 在 这 种 范式 中 涉及 了 哪 种 函数 依赖 ? 
20. 使 用 参考 资料 或 因特网 查找 关于 Boyce-Codd 范式 (BCNF ) 的 资料 ， 在 这 种 范式 中 涉及 了 哪 种 函数 


依赖 ? 
小 程序 
为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通 过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨 论 材 料 的 理解 。 


| 第 1S 章 


Foundations of Computer Science, Third Edition 


数据 压缩 





近来 ， 技 术 改 变 了 我 们 传输 和 存储 数据 的 方式 。 例 如 ， 光 纤 电 缆 使 我 们 能 更 加 快速 地 传 
输 数 据 ，DVD 技术 使 得 在 较 小 物理 媒介 上 存储 大 量 的 数据 成 为 可 能 。 然 而 ， 如 同 生活 的 其 
他 方面 一 样 ， 人 们 的 要 求 也 正 逐 渐 增 加 。 今 天 ， 人 们 和 希望 在 更 短 的 时 间 内 下 载 更 多 的 数据 。 
同样 ， 人 们 也 希望 能 在 更 小 的 空间 存储 更 多 的 数据 。 

压缩 数据 通过 部 分 消除 数据 中 内 在 的 元 余 来 减少 发 送 或 存储 的 数据 量 。 当 我 们 产生 数据 
的 同时 ， 宛 余 也 就 产生 了 。 通 过 数据 压缩 ， 提 高 了 数据 传输 和 存储 的 效率 ， 同 时 保护 了 数据 
的 完整 性 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

e 区 分 无 损 压 缩 和 有 损 压缩 ; 
描述 游程 长 度 编码 和 它 是 如 何 实现 压缩 的 ; 
描述 赫 夫 曼 编码 和 它 是 如 何 实现 压缩 的 ; 
描述 Lempel Ziv 编码 以 及 字典 在 编码 和 译 码 中 的 作用 ; 
描述 压缩 静止 图 像 的 JPEG 标准 背后 的 主要 思想 ; 
描述 压缩 视频 的 MPEG 标准 背后 的 主要 思想 以 及 它 与 JPEG 间 的 关系 ; 
描述 压缩 音频 的 MP3 标准 背后 的 主要 思想 。 


15.1 引言 


数据 压缩 意味 着 发 送 或 是 存储 更 少 的 位 数 。 虽 然 有 很 多 方法 用 于 此 目的 ;但 这 些 方法 一 
般 可 分 为 两 类 : 无 损 压 缩 和 有 损 压 缩 。 图 15-1 给 出 了 这 两 类 以 及 每 类 中 常用 的 一 些 方法 。 





数据 压缩 方法 





无 损 方法 有 损 方 法 
(文本 或 程序 ) (图 像 、 视频 、 音 频 ) 


图 15-1 数据 压缩 方法 
我 们 首先 讨论 比较 简单 和 容易 理解 的 无 损 压缩 ， 再 介绍 复杂 些 的 有 损 压缩 。 


15.2 无损 压 缩 


在 无 损 数据 压缩 中 ， 数 据 的 完整 性 是 受到 保护 的 。 原 始 数据 与 压缩 和 解压 后 的 数据 完全 
一 样 。 因 为 在 这 种 压缩 方法 中 ， 压 缩 和 解压 算法 是 完全 互 反 的 两 个 过 程 ， 在 处 理 过 程 中 没有 
数据 丢失 。 宛 余 的 数据 在 压缩 时 被 移 走 ， 在 解压 时 再 被 加 回去 。 
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通常 这 种 方法 在 不 想 丢 失 数据 时 使 用 。 例 如 ， 当 压缩 文档 资料 或 应 用 程序 时 ， 我 们 当然 
不 希望 丢失 其 中 的 数据 。 

本 节 中 我 们 将 讨论 三 种 无 损 压 缩 方法 ， 分 别 为 : 游程 长 度 编码 、 赫 夫 曼 编码 、Lempel 
Ziv 算法 。 


15.2.1 游程 长 度 编码 


游程 长 度 编 码 也 许 是 最 简单 的 压缩 方法 ， 可 以 用 来 压缩 由 任何 符号 组 成 的 数据 。 它 不 
需要 知道 字符 出 现 频 率 的 有 关 知 识 ( 赫 夫 曼 编码 则 需要 )， 并 且 当 数据 中 由 0 和 1 表示 时 十 分 
有 效 。 

这 种 算法 的 大 致 思想 是 将 数据 中 连续 重复 出 现 的 符号 用 一 个 字符 和 这 个 字符 重复 的 次 数 
来 代替 。 例 如 ，AAAAAAAA 可 以 用 A08 来 代替 。 图 15-2 显示 了 这 种 简单 压缩 方法 的 一 个 
示例 。 注 意 ， 我 们 使 用 固定 位 数 (2 位 ) 的 数字 来 表示 数 。 


BBBBBBBBBAAAAAAAAAAAAAAAANMMMMMMMMMM 


b) 压缩 数据 


a) 原始 数据 






图 15-2 游程 长 度 编码 的 例子 


在 位 模式 中 ， 如 果 数 据 只 用 两 种 符号 (0 和 1 )， 并 且 一 种 符号 比 另 一 种 符号 使 用 更 为 频 
繁 ， 那么 这 种 压缩 方法 就 更 有 效 。 例 如 ， 假 设 一 段 数据 里 面 有 很 多 的 0 而 1 很 少 ,那么 ,就 
可 以 通过 在 发 送 (或 存储 ) 时 只 标记 在 两 个 1 中 间 有 多 少 个 0 来 减少 数据 的 位 数 (图 15-3 )。 





a) 原始 数据 
0000000000000010000110000000C0000 
14 4 0 12 
b) 压缩 数据 


图 15-3 ”两 个 字符 的 游程 长 度 编码 


这 里 我 们 用 4 位 二 进 制 数 (无 符号 整数 ) 计数 。 实 际 中 ， 为 避免 引入 额外 元 余 ， 我 们 应 
该 寻找 一 个 最 佳 的 位 数 来 计数 。 在 图 15-3 中 ， 第 一 个 1 之 前 有 14 个 0, 这 14 个 0 被 压缩 
成 二 进 制 模式 T110( 二 进 制 中 表示 14 )。 接 下 来 的 一 组 连续 的 0 被 压缩 成 0100， 因 为 有 4 个 0。 
后 面 又 接着 的 两 个 连续 的 1， 压缩 时 用 0000 替代 。 最 后 数据 中 的 12 个 0 被 压缩 成 1100。 

注意 : 用 4 位 二 进 制 压缩 时 ， 如 果 连 续 的 0 多 于 15 个 ,它们 将 被 分 为 2 组 或 者 更 多 的 
组 。 例 如 ， 连 续 的 25 个 0 编码 为 1111 1010。 现 在 的 问题 则 是 : 接收 者 如 何 知道 这 是 25 个 
0 而 不 是 连续 15 个 0 后 接着 1 个 1， 然 后 再 接 10 个 0? 答案 是 ， 如 果 第 一 个 计数 是 1111， 
我 们 就 默认 下 一 个 4 位 模式 仍然 是 用 于 表示 连续 0 的 数目 。 而 另 一 个 问题 又 产生 了 : 假如 2 
个 1 之 间 刚 好 15 个 0 时 又 怎么 办 呢 ? 这 种 情况 下 的 模式 是 1111 后 再 紧 跟 0000。 
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15.2.2 ”区 夫 曼 编码 


在 赫 夫 曼 编码 中 ， 对 于 出 现 更 为 频繁 的 字符 分 配 较 短 的 编码 ， 而 对 于 出 现 较 少 的 字符 分 
配 较 长 的 编码 。 例 如 ， 假 使 有 一 篇 文本 文件 只 用 到 了 5 个 字符 (A，B，,，C，D, E)。 这 里 为 
了 讨论 的 方便 只 选 5 个 字符 ， 但 该 程序 对 于 字符 数目 的 多 少 都 同样 有 效 。 

在 给 每 个 字符 分 配 位 模式 前 ， 首 先 根据 每 个 字符 的 使 用 频率 给 它们 分 配 相 应 的 权 值 。 在 
这 个 例子 中 ， 假 定 字符 出 现 的 频率 如 表 15-1 所 示 。 字 符 A 出 现 的 频率 为 17%， 字 符 B 出 现 
的 频率 为 12%， 等 等 。 


表 15-1 字符 的 出 现 频率 
一 旦 建立 了 各 个 字符 的 权 值 后 ， 就 可 以 根据 这 些 值 构造 一 棵 树 。 构 造 树 的 过 程 如 图 15-4 
所 示 。 它 遵循 以 下 三 个 基本 步骤 : 
1 ) 将 全 部 字符 排 成 一 排 。 每 个 字符 现在 都 是 树 的 最 底层 节点 。 
2 ) 找 出 权 值 最 小 的 两 个 节点 并 由 它们 合成 第 三 个 节点 ， 产 生 一 棵 简单 的 二 层 树 。 新 节 
点 的 权 值 由 最 初 的 两 个 节点 的 权 值 结合 而 成 。 这 个 节点 ， 在 叶子 节点 的 上 一 层 ， 可 以 再 与 其 


他 的 节点 结合 。 请 记 住 ， 选 择 所 结合 的 两 个 节点 的 权 值 和 必须 比 其 他 所 有 可 能 的 选择 小 。 
3 ) 重复 步骤 2 )， 直 到 各 个 层 上 的 所 有 节点 结合 成 为 一 棵 树 。 


41 
gb el 
©®ODOOOD ©®O®OO0OD® WBOD®D® 
17 12 12 27 32 17 27 32 27 32 
a) b) c) 


100 
41 
59 
人 WBOD ED 
d) ©) 


图 15-4 赫 夫 曼 编码 


树 的 构造 完成 后 ， 利 用 它 来 给 各 个 字符 分 配 编码 。 首 先 ， 给 每 个 分 支 分 配 1 位 。 从 根 
(顶部 节点 ) 开始 ， 给 左 分 支 分 配 0， 给 右 分 支 分 配 1， 然 后 在 其 他 各 个 节点 重复 这 一 模式 。 
一 个 字符 的 编码 是 这 样 得 到 的 ， 首 先 从 根 
开始 ， 沿 着 分 支 到 达 字 符 所 在 的 位 置 。 该 字符 
的 编码 就 是 所 经 过 的 路 径 上 各 分 支 位 值 的 顺序 


:00 
排列 。 图 15-5 给 出 了 最 终 的 生成 树 和 相对 应 的 i 
编码 。 注 意 我 们 移动 了 叶子 节点 以 使 整 棵 树 更 co 
像 一 棵 二 叉 树 。 编码 





注意 这 些 编码 的 要 点 ， 首 先 ， 出 现 频率 高 
的 字符 (A、D 和 E) 的 编码 要 比 出 现 频率 低 的 图 15-5 最 终生 成 树 和 编码 
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字符 (B 和 C) 的 编码 短 。 这 点 可 以 通过 比较 分 配给 各 个 字符 的 编码 适当 的 位 长 度 看 出 。 其 
次 ， 在 这 个 编码 系统 中 ,没有 一 个 编码 是 其 他 编码 的 前 级 。 图 中 2 位 编码 00、10 或 者 11， 
都 不 是 其 他 两 种 编码 (010，011 ) 中 任何 一 个 的 前 级 。 换 句 话说 ,不 存在 一 个 3 位 编码 是 以 
00、10 或 11 开头 的 ， 这 个 特性 使 得 赫 夫 曼 编 码 是 一 种 即时 的 编码 。 我 们 将 会 在 讨论 赫 夫 曼 
编码 的 编码 和 译 码 时 解释 这 个 问题 。 

1. 编码 

让 我 们 看 看 怎样 用 这 5 个 字符 的 编码 压缩 文档 。 如 图 15-6 所 示 是 编码 前 后 的 文本 。 

这 里 有 两 点 值得 注意 。 首 先 ， 请 注意 ， 即 使 是 这 样 小 的 不 切实 际 的 编码 压缩 也 有 其 意 
义 。 如 果 想 在 不 压缩 成 赫 夫 曼 编码 的 情况 下 就 发 送 这 个 文本 ,那么 需要 给 每 个 字符 一 个 3 位 
编码 ， 总 共和 需 传送 30 位 ， 而 用 赫 夫 曼 编 码 则 只 发 送 22 位 。 

其 次 ， 注 意 ， 我 们 没有 在 每 个 字符 的 编码 中 间 加 上 分 隔 符 。 我 们 只 是 一 个 接 一 个 地 写 
代码 。 赫 夫 曼 编码 的 好 处 就 是 没有 一 个 编码 是 其 他 编码 的 前 级 ， 这 样 在 编码 过 程 中 没有 二 义 
性 ， 接 收 方 接收 到 数据 解压 缩 时 也 不 会 产生 二 义 性 。 

2. 译 码 . 

接收 方 译 码 十 分 容易 。 图 15-7 给 出 了 译 码 的 过 程 。 当 接收 方 收 到 前 2 位 数 的 时 候 ， 它 
不 必 等 收 到 下 一 个 位 就 可 以 译 码 。 它 知道 应 该 译 码 为 E。 其 原因 是 ， 这 两 位 不 是 任何 3 位 码 
前 级 (没有 11 开头 的 3 位 码 )。 同 样 ， 当 接收 方 收 到 下 两 位 时 (00 ) 时 ， 它 也 知道 应 该 翻译 
为 A。 再 下 两 位 以 同样 的 方式 翻译 ( 11 一 定 是 E)。 然 而 ， 当 收 到 第 7 和 第 8 位 时 ， 计 算 机 
知道 需要 等 下 一 位 ， 因 为 编码 01 不 在 编码 表 里 。 当 收 到 下 一 位 (0 ) 时 ， 它 将 这 3 位 连 在 一 
起 (010 ) 翻译 为 B。 这 就 是 赫 夫 曼 编 码 称 为 即时 码 的 原因 。 译 码 器 可 以 即时 明确 地 翻译 出 
编码 (在 最 小 位 数 下 ) 。 


文本 替 夫 曼 码 


EAEBAECDEA 


A 一 00 D 一 10 
B 一 010 了 一 11 
C 一 011 









1100110100011011101100 











00 一 A 010 一 B 
10 一 D ”011 一 C |‖ 译 码 器 
11 一 耻 


编码 器 


1100110100011011101100 EAEBAECDEA 


赫 夫 曼 码 文本 
图 15-6 赫 夫 曼 编 码 图 15-7 赫 夫 曼 译 码 


15.2.3 Lempel Ziv 编码 


Lempel Ziv ( LZ) 编码 是 称 为 基于 字典 的 编码 的 那 一 类 算法 的 一 个 例子 它 是 用 其 发 命 者 
的 名 字 ( Abraham Lempel 和 Jacob Ziv) 命名 的 。 在 通信 会 话 的 时 候 它 将 产生 一 个 字符 串 字 
典 (一 个 表 )。 如 果 接 收 和 发 送 双 方 都 有 这 样 的 字典 ， 那 么 字符 串 可 以 由 字典 中 的 索引 代替 ， 
以 减少 通信 的 数据 传输 量 。 

尽管 方案 看 似 简 单 ， 但 执行 起 来 仍然 有 些 困 难 。 首 先 ， 怎 样 为 每 一 次 通信 会 话 产生 一 个 
字典 (由 于 字符 串 的 长 度 不 定 ， 很 难 找 到 通用 的 字典 ) ? 其 次 ， 接 收 方 怎样 获得 发 送 方 的 字 
典 (如 果 同 时 发 送 字典 ， 就 增加 了 额外 的 数据 ， 这 样 ， 与 我 们 压缩 的 目的 是 相悖 的 ) ? 
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一 个 实用 的 算法 是 Lempel Ziv (LZ) 算法 ， 该 算法 是 基于 字典 的 自 适应 编码 的 思想 。 这 
种 算法 有 不 同 的 版 本 (LZ77、LZ78 等 )。 我 们 以 一 个 实例 来 介绍 这 个 算法 的 基本 思想 ， 但 不 
涉及 不 同 版 本 和 实现 的 具体 细节 。 在 例子 中 ,假设 要 发 送 的 字符 串 如 下 所 示 ， 选 择 这 个 特殊 
的 字符 串 是 为 了 讨论 方便 。 

BAABABBBAABBBBAA 

使 用 LZ 算法 的 简单 版 本 ， 整 个 过 程 分 为 两 个 阶段 :压缩 字符 串 和 解压 缩 字符 串 。 

1. 压缩 

这 个 阶段 ， 需 要 同时 做 有 两 件 事 : 建立 字典 索引 和 压缩 字符 串 。 算 法 从 未 压缩 的 字符 
串 中 选取 最 小 的 子 字符 串 ， 这 些 子 字符 串 在 字典 中 不 存在 。 然 后 将 这 个 子 字符 串 复 制 到 字典 
(作为 一 个 新 的 记录 ) 并 为 它 分 配 一 个 索引 值 。 压 缩 时 ， 除 了 最 后 一 个 字母 之 外 ， 其 他 所 有 
字符 被 字典 中 的 索引 代替 。 然 后 将 索引 和 最 后 一 个 字母 插入 压缩 字符 串 。 比 如 ABBB ， 在 字 
典 中 找到 ABB 和 它 的 索引 4， 得 到 的 压缩 字符 串 就 是 4B。 图 15-8 显示 了 这 个 过 程 。 


BAABABBBAABBBBAA 


对 字符 串 进行 
语法 分 析 


对 字符 串 进行 
语法 分 析 


对 字符 串 进行 
语法 分 析 


B, A, 2B 一 要 对 一 ABABBBAABBBBAA 


对 字符 串 进行 
语法 分 析 


B, A, 2B, 3B S15 和 <= ABBBAABBBBAA 


对 字符 串 进 行 
语法 分 析 


对 字符 串 进行 
语法 分 析 


B, A, 2B, 3B, 1A, 4B 11 人 BBBBAA 


对 字符 串 进行 
语法 分 析 


多 
B, A, 2B, 3B, 1A, 4B, 5A EL BAA 





B, A, 2B, 3B, 1A, 4B, 5A 


图 15-8 ”Lempel Ziv 编码 的 例子 
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让 我 们 看 看 这 里 的 几 个 步骤 : 

(1 ) 第 一 步 

压缩 过 程 从 原始 字符 串 中 选择 不 在 字典 中 的 最 小 子 字符 串 。 因 字典 是 空 的 ， 最 小 字符 串 
是 单字 符 (第 一 个 字符 是 B)。 于 是 将 它 作为 第 一 条 记录 加 入 字典 并 赋予 索引 值 1。 这 个 子 字 
符 串 不 存在 子 串 可 以 被 字典 中 的 索引 取代 的 情况 〈 因 为 它 只 有 一 个 字符 )。 压 缩 过 程 将 B 插 
和 人 压缩 字符 串 。 至 此 ， 压 缩 字 符 串 仅 有 一 个 字符 B， 而 未 压缩 的 字符 串 则 由 原始 的 字符 串 中 
减 去 了 第 一 个 字符 。 

(2 ) 第 二 步 

压缩 过 程 选 择 下 一 个 不 在 字典 中 的 最 小 子 字符 串 。 这 里 是 A， 压 缩 过 程 将 A 作为 第 二 
条 记录 加 入 字典 。 这 个 子 字符 串 也 不 存在 子 串 可 以 被 字典 中 的 索引 取代 〈 它 仅 有 一 个 字母 ) 。 
压缩 过 程 将 A 加 入 压缩 字符 串 。 至 此 ， 压 缩 字符 串 里 就 有 了 两 个 字母 B 和 A (在 压缩 字符 
串 中 ， 相 邻 的 子 字符 串 之 间 加 逗号 以 示 隔 开 )。 

(3 ) 第 三 步 

压缩 过 程 继 续 选 择 下 一 个 不 在 字典 中 的 最 小 子 字符 串 。 此 时 的 情况 与 前 两 步 不 同 ， 下 一 
个 字符 (A) 已 经 在 字典 中 了 ， 因 此 此 时 选择 的 字符 串 为 AB。 它 在 字典 中 并 不 存在 ， 于 是 将 
AB 作为 第 三 条 记录 加 入 字典 。 压 缩 过 程 发 现 字典 里 存在 这 个 字符 串 除去 最 后 一 个 字符 的 子 
串 (AB 除去 最 后 一 个 字符 为 A)， 而 A 在 字典 中 的 索引 号 为 2， 所 以 压缩 过 程 用 2 代替 A 并 
将 2B 加 入 压缩 字符 串 中 。 

(4) 第 四 步 

接着 ， 压 缩 过 程 选择 了 ABB (因为 字典 中 已 经 存在 A、AB)， 并 将 ABB 作为 第 四 条 记 
录 加 入 字典 ， 赋 予 索 引 值 4。 压 缩 过 程 这 时 发 现 字典 里 存在 该 子 串 除去 最 后 一 个 字符 的 子 串 
(AB)， 其 索引 值 为 3。 于 是 3B 加 入 压缩 字符 串 中 。 

细心 的 读者 也 许 已 经 注意 到 了 ， 在 前 面 的 三 步 中 ， 我 们 实际 上 并 未 实现 任何 压缩 。 因 为 
一 个 字符 的 码 被 一 个 所 代替 (第 一 步 中 A 被 A 人 代替， 第 二 步 中 B 被 B 代替 )， 两 个 字符 被 两 
个 字符 所 代替 (第 三 步 中 AB 被 2B 代替 )。 但 是 在 这 一 步 当 中 我 们 确实 减少 了 字数 (ABB 变 
成 了 3B)， 如 果 原 始 的 字符 串 出 现 了 许多 这 样 的 重复 字符 串 ，( 在 大 多 数 情况 下 该 情况 确实 存 
在 )， 那 么 我 们 便 可 以 大 大 地 减少 字符 的 数量 。 

剩 下 的 几 步 与 前 述 的 四 步 相似 。 需 要 注意 的 是 ， 这 里 字典 仅仅 为 发 送 方 用 来 寻找 索引 ， 
而 并 没有 传送 到 接收 方 。 实 际 上 正如 下 一 节 所 述 ， 接 收 方 必须 自己 来 创建 字典 。 

2. 解压 

解压 是 压缩 的 逆 过 程 。 该 过 程 从 压缩 的 字符 串 中 取出 子 字符 串 ， 然 后 尝试 按照 字典 中 所 
列 出 的 记录 还 原 相 应 的 索引 号 为 对 应 的 字符 串 。 字 典 开 始 为 空 ， 之 后 会 逐渐 地 建立 起 来 。 该 
过 程 的 总 体 思 路 是 当 一 个 索引 号 被 接收 时 ， 在 字典 中 已 经 存在 了 与 其 相应 的 记录 。 图 15-9 
给 出 了 解压 的 过 程 。 

让 我 们 来 看 看 如 何 完 成 图 中 所 示 各 步骤 : 

(1) 第 一 步 

检验 第 一 个 被 压缩 的 子 字 符 串 ， 它 是 没有 索引 号 的 字符 B。 因 为 子 字符 串 不 在 字典 中 ， 
因此 将 其 添加 到 字典 中 。 这 样子 字符 串 B 被 插入 解压 的 字符 串 中 。 

(2 ) 第 二 步 

检验 第 二 个 被 压缩 的 子 字 符 串 ( A)， 情 况 与 上 一 步 类 似 。 这 样 解压 的 字符 串 中 就 有 了 两 
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个 字符 (B、A)。 字 典 中 此 时 也 有 了 两 条 记录 。 


B, A, 2B, 3B, 1A, 4B, 5A 


对 字符 串 进行 
语法 分 析 


B Am A, 2B, 3B, 1A, 4B, SA 
对 字符 串 进行 
语法 分 析 


对 字符 串 进 行 
语法 分 析 


ry -一 其 一 3B, 1A, 4B, 5A 


对 字符 申 进行 

[Bl ATAB TAGS 语法 分 析 

[AAA < 有一 1A, 4B, 5A 
对 字符 串 进行 

和 4B, 5A 


对 字符 串 进行 


BAABABBBAABBBBAA 和-- 


BAABABBBAABBBBAA 





图 15-9 Lempel Ziv 译 码 的 例子 


(3 ) 第 三 步 

检验 第 三 个 被 压缩 的 子 字 符 串 (2B)， 查 找 字 典 ， 用 子 字符 串 A 代替 索引 号 2。 于 是 子 
字符 串 (AB) 就 被 加 到 解压 的 字符 串 中 ， 并 将 AB 添加 到 字典 中 。 

(4) 第 四 步 

检验 第 四 个 被 压缩 的 子 字符 串 (3B)， 查 找 字 典 ， 用 子 字符 串 AB 代替 索引 号 3。 于 是 
子 字符 串 ABB 就 被 添加 到 解压 的 字符 串 中 ， 并 将 ABB 添加 到 字典 中 。 

剩 下 的 三 步 留 给 读者 作为 练习 。 当 然 我 们 注意 到 ， 这 里 用 1 或 2 等 数字 作为 索引 号 。 在 
实际 中 ， 为 提高 效率 ， 索 引号 是 位 模式 的 (长度 是 变化 的 ) 。 同 样 我 们 也 注意 到 ，LZ 编码 没 
有 压缩 最 后 一 个 字符 (这 意味 着 降低 了 压缩 的 效率 ) 。LZ 编码 的 一 个 版 本 ， 叫 做 Lempel Ziv 
Welch ( LZW) 编码 ， 则 将 这 最 后 的 一 个 字符 也 压缩 了 。 有 关 此 类 算法 的 讨论 我 们 留 给 其 他 
专业 教科 书 。 
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15.3 ”有 损 压 缩 方法 


信息 的 丢失 无 论 在 文本 文件 还 是 程序 文件 中 都 是 不 能 接受 的 。 但 是 在 图 片 、 视 频 或 音频 
文件 中 是 可 以 接受 的 。 这 是 因为 我 们 的 眼睛 和 耳 条 并 不 能 够 分 辨 出 如 此 细小 的 差别 。 因 此 对 
于 这 些 情况 ， 可 以 使 用 有 损 数据 压缩 的 方法 。 这 使 得 我 们 在 以 每 秒 传送 数 百 万 位 的 图 像 和 视 
频数 据 时 只 需 花 费 更 少 的 时 间 和 空间 以 及 更 廉价 的 代价 。 

有 关 有 损 压缩 的 技术 已 经 存在 一 些 成 熟 的 方法 。 联 合 图 像 专 家 组 (JPEG) 用 来 压缩 图 片 
和 图 像 ， 运 动 图 像 专家 组 ( MPEG) 用 来 压缩 视频 ，MPEG 第 三 代 音 频 压 缩 格式 (MP3 ) 则 
用 来 压缩 声音 。 


15.3.1 图 像 压 缩 : JPEG 


正如 第 2 章 讨 论 过 的 ， 一 幅 图 像 可 以 通过 一 个 二 维 数 组 ( 表 ) 来 表示 图 像 元 素 (像素 )， 
例如 ，640X480=307 200 像素 。 如 果 图 像 是 灰 度 的 ， 那 么 像素 可 以 由 一 个 8 位 整数 (256 
个 灰 度 级 别 ) 来 表示 ， 如 果 图 像 是 彩色 的 ， 每 个 像素 可 以 由 24 位 表示 (3X8 位 )， 其 中 每 
8 位 表示 RBG 颜色 系统 中 的 一 个 颜色 。 为 了 讨论 的 简单 ， 我 们 假定 图 像 是 灰 度 的 且 有 
640X 480 像素 。 我 们 可 以 看 到 为 什么 需要 压缩 ， 一 个 有 307 200 像素 的 灰 度 图 像 需要 用 
2 457 600 位 来 表示 ， 而 彩色 图 片 则 需要 7 372 800 位 来 表示 。 

在 JPEG 中 ， 一 幅 灰 度 图 像 将 被 分 成 许多 8X 8 的 像素 块 (图 15-10 ) 。 将 图 像 划 分 成 
块 的 目的 是 考虑 到 减少 计算 量 。 显 而 易 见 ， 
此 时 每 幅 图 像 的 数学 运算 量 是 单元 数 的 平 
方 。 也 就 是 说 ， 整 个 图 像 需要 307 200? 次 运 
算 (94 371 840 000 次 运算 )。 而 如 果 使 用 
JPEG， 则 需要 对 每 个 块 进行 64? 次 运算 ， 总 
共 是 642X80X60， 即 19 660 800 次 运算 。 J 
这 将 原来 的 运 措 重 减 少 到 4800 分 之 一 。 图 15-10 灰 度 JPEG 图 像 的 例子 ，640X 480 像素 

JPEG 的 整体 思想 是 将 图 像 变换 成 一 个 数 
的 线性 (矢量 ) 集合 来 揭示 元 余 。 这 些 元 余 (缺乏 变化 的 ) 可 以 通过 使 用 前 面 学 过 的 无 损 压 
缩 的 方法 来 除去 。 图 15-11 给 出 了 一 个 简单 版 本 的 处 理 过 程 。 





JPEG 的 三 个 步 又 





0011... 0001 
压缩 后 的 图 像 





分 块 后 的 图 像 


图 15-11 JPEG 处 理 过 程 


1. 离散 余弦 变换 

在 此 步骤 中 ， 每 个 64 像素 块 都 要 用 离散 余弦 变换 ( DCT) 进行 变换 。 这 种 变换 改变 了 
64 个 值 以 使 相 邻 像素 之 间 的 关系 得 以 保持 , 但 同时 又 能 够 揭示 元 余 。 在 附录 G 中 给 出 了 
相应 的 公式 。P(x, y) 定义 了 每 个 块 上 的 值 ; 7T(m, n) 则 定义 了 变换 后 的 块 的 值 。 

为 了 理解 该 变换 的 本 质 ， 让 我 们 研究 以 下 三 种 情况 变换 后 的 结果 。 
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(1) 情况 1 

在 此 情况 中 ,图像 中 每 个 块 都 有 统一 的 灰 度 ,每 个 像素 的 灰 度 值 是 20。 当 进行 变换 
后 ， 我 们 得 到 第 一 个 像素 (左上 角 ) 的 一 个 非 零 值 。 其 余 像 素 的 结果 为 零 。 这 是 由 于 根 
据 公 式 ，7(0, 0) 是 其 他 值 的 平均 值 。 我 们 称 为 DC 值 (直流 ,借用 电气 工程 中 的 概念 )。 
T(m, n) 中 其 余 的 值 称 为 AC 值 ， 表 示 像 素 值 的 变化 。 因 为 这 里 没有 变化 ， 所 以 其 他 的 值 为 0 
(图 15-12 ) 。 
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15-12 情况 1: 统一 的 灰 度 类 型 


6 
0 
0 
0 
0 
0 
0 
0 


Oooooooo 
Soooooo 
Oooooooo 
Sooooooo 
Sooooooo 
Oooooooo 





(2 ) 情况 2 

在 第 二 种 情况 中 ， 有 一 个 分 成 两 种 不 同 灰 度 级 区 域 的 块 。 像 素 的 值 有 一 个 明显 的 变化 
(从 20 到 50 )。 当 做 变换 时 ， 得 到 一 个 DC 值 和 非 零 AC 值 。 但 此 时 只 有 很 少 的 非 零 值 复 绕 
着 DC 值 ， 其 余 绝 大 多 数值 都 是 0 (图 15-13 ) 。 
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P(x, y) “7 (m, n) 
图 15-13 ”情况 2: 两 区 域 灰 度 类 型 


(3 ) 情况 3 
在 第 三 种 情况 中 ， 有 一 个 渐变 灰 度 的 块 。 也 就 是 说 ， 相 邻 像素 值 之 间 没 有 突变 。 当 做 变 
变 时 ， 得 到 一 个 DC 值 和 许多 非 零 AC 值 (图 15-14 ) 。 
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图 15-14 情况 3: 渐变 灰 度 类 型 


从 图 15-12、 图 15-13 和 图 15-14， 我 们 可 以 叙述 如 下 : 
。 转换 从 尸 表 生成 了 表 。 

。 DC 值 是 像素 的 平均 值 。 

e AC 值 显示 变化 。 
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e 邻近 像素 缺少 变化 的 生成 0。 

我 们 应 注意 DCT 是 可 逆 的 。 附 录 G 同样 也 给 出 了 逆 变 换 的 数学 公式 。 

2. 量化 

生成 了 表 后 ， 这 些 值 将 被 量化 以 减少 需要 编码 的 位 数 。 量 化 过 程 用 一 个 常量 来 除 位 数 ， 
然后 舍弃 小 数 部 分 。 这 样 可 以 更 加 减少 需要 编码 的 位 数 。 在 大 多 数 实 现 方法 中 ， 通 过 一 张 量 
化 表 (8X8 ) 定义 了 如 何 量化 每 个 值 ， 其 中 除数 取决 于 了 表 位 置 上 的 值 。 这 样 做 可 以 对 每 一 
个 特殊 的 应 用 程序 优化 位 数 和 0 的 个 数 。 

注意 在 整个 过 程 中 只 有 量化 阶段 是 不 可 逆 的 。 在 这 里 所 失去 的 一 些 信息 是 不 能 恢复 的 。 
事实 上 ，JPEG 之 所 以 称 为 有 损 压 缩 就 是 因为 量化 过 程 所 带 来 的 损失 。 

3. 压缩 

量化 后 ， 将 表 中 的 值 读 出 并 去 掉 多 余 的 0。 但 是 , 为 了 把 0 
聚集 起 来 ， 整 个 压缩 过 程 以 乙 字 形 按 对 角 线 读 取 表 ， 而 不 是 按 行 
或 列 。 原 因 是 如 果 图 像 没 有 很 好 的 变化 ，7 表 底部 的 右 下 角 将 全 为 
0。 图 15-15 给 出 了 该 过 程 。JPEG 在 压缩 阶段 通常 使 用 游程 长 度 
编码 来 压缩 从 Z 字形 线性 化 读 取 的 位 模式 。 


15.3.2 ”视频 压缩 : MPEG 


运动 图 像 专家 组 (MPEG ) 方法 用 于 压缩 视频 。 原 则 上 ， 一 
个 运动 的 图 像 是 一 系列 快速 帧 的 序列 。 每 个 帧 都 是 一 幅 图 像 。 换 EU 
句 话说 ， 帧 是 像素 在 空间 上 的 组 合 ， 视 频 是 一 幅 接 一 幅 发 送 的 帧 
的 时 间 组 合 。 压 缩 视 频 ， 就 是 对 每 帧 空间 上 的 压缩 和 对 一 系列 帧 图 15-15 读 表 
时 间 上 的 压缩 。 
(1 ) 空间 压 间 
每 一 帧 的 空间 压缩 使 用 JPEG (或 它 的 改进 版 ) 。 每 一 帧 都 是 一 幅 图 ， 可 以 单独 压缩 。 
(2 ) 时 间 压 缩 
在 时 间 压 缩 中 ， 多 余 的 帧 将 被 丢弃 。 当 我 们 看 电视 时 ， 每 秒 接收 30 帧 。 但 是 ， 大 多 数 
连续 的 帧 几乎 是 一 样 的 。 例 如 ， 当 一 个 人 说 话 时 ， 大 部 分 帧 除了 用 于 表示 嘴唇 附近 的 帧 的 片 
段 不 断 变化 外 ， 与 其 前 面 的 帧 几乎 相同 。 
通过 粗略 的 估算 就 可 以 证 明 视 频 时 间 压 缩 的 需要 。 一 个 20:1 的 JPEG 压缩 图 像 每 帧 需要 
发 送 368 640 位 ; 每 秒 30 帧 ， 则 每 秒 需 要 传送 11 059 200 位 ， 显 然 我 们 需要 减少 该 数量 。 
为 了 压缩 时 间 数 据 ，MPEG 方法 首先 把 帧 分 成 三 类 : 工 帧 、P- 帧 、B- 帧 。 
e |- 帧 : 即 内 部 编码 帧 (I- 帧 )， 是 一 个 独立 帧 ， 该 帧 与 任何 其 他 帧 ( 即 在 其 前 发 送 的 
帧 或 者 在 其 后 发 送 的 帧 ) 无 关 。 它 们 以 周期 性 间隔 出 现 (比如 : 每 9 个 帧 中 有 一 个 
I- 帧 ) 。LI- 帧 必须 是 周期 性 出 现 ， 因 为 该 帧 的 突然 变化 将 使 得 其 前 面 的 帧 和 后 面 的 帧 
不 能 正常 显示 。 同 样 ， 当 播放 视频 的 时 候 ， 观 众 可 能 会 随时 调整 接收 机 。 如 果 仅 仅 
在 播放 开始 时 有 一 个 工 帧 ,那么 随后 调整 频道 的 观众 将 不 能 收 到 完整 的 画面 。I- 帧 
独立 于 其 他 帧 之 外 ， 而 且 不 能 由 其 他 帧 构造 。 
e P- 帧 : 即 预 帧 (P- 帧 )， 与 前 面 的 I 帧 或 P- 帧 有 关联 。 换 名 话说， 每 个 P- 帧 都 从 前 
面 帧 变化 而 来 。 不 过 变化 不 能 覆盖 大 的 部 分 。 例 如 ， 对 于 一 个 快速 移动 的 目标 ， 新 
变化 也 许 没有 记录 在 P- 帧 中 。P- 帧 可 以 通过 先前 的 工 帧 或 P- 帧 产生 。P- 帧 携带 的 
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信息 比 其 他 类 型 的 帧 少 ， 而 且 压缩 后 会 更 少 。 
e B- 帧 : 即 双向 帧 ( B- 帧 )， 与 前 面 和 后 续 的 工 帧 或 P- 帧 有 关系 。 换 句 话 说， 每 个 B- 
帧 都 与 过 去 和 将 来 有 关系 。 注 意 B- 帧 不 会 与 另 一 个 B- 帧 有 关系 。 
图 15-16 显示 了 帧 的 样本 序列 以 及 它们 是 如 何 构造 的 。 注 意 一 下 译 码 ， 译 码 过 程 应 该 
在 B- 帧 之 前 接收 到 P- 帧 ， 基 于 这 个 原因 ， 帧 发 送 的 顺序 与 它们 显示 在 接收 应 用 中 的 顺序 不 
同 。 帧 发 送 顺序 为 : I, P, B, B, P, B, B, I。 





图 15-16 MPEG 帧 


1. 版 本 

MPEG 有 很 多 版 本 。 上 面 讨论 的 是 与 MPEG-1 相关 的 ，MPEG-2 是 1991 年 引入 的 ， 
gt ee ee TIEITWI 
MPEG 的 最 近 的 一 个 版 本 称 为 MPEG-7， 它 叫 作 “多 媒体 内 容 描述 接口 ”"。MPEG-7 大 部 分 
是 使 用 XML 描述 元 数据 (关于 数据 的 数据 ) 和 对 视频 中 所 含 内 容 的 描述 的 标准 。 


15.3.3 ”音频 压缩 


音频 压缩 可 以 用 来 处 理 语音 和 音乐 。 对 于 语音 ， 我 们 需要 压缩 一 个 64 kHz 的 数字 化 信 
各 ， 人 0 对 于 种 洒 我 们 第 要 痕 乡 一 个 1.41[ WE 的 及 半 。 用 活 拓 玉 用 二 进行 将 质 压 维 。 御 网 
编码 和 感知 编码 。 

1. 预测 编码 

在 预测 编码 中 ， 样 本 间 的 差别 被 编码 ， 而 不 是 对 所 有 的 样本 值 进行 编码 。 这 样 压缩 方法 
通常 用 在 语音 上 。 已 经 定义 的 标准 有 : GSM (13 kbps)、G.729 (8 kbps) 和 G.723.3 ( 6.4 kbps 
或 5.3 kbps)。 这 些 技术 的 详细 讨论 超过 了 本 书 的 范围 。 

2. 感知 编码 : MP3 

用 来 创建 CD 质量 音频 最 常用 的 压缩 技术 是 基于 感知 编码 技术 的 。 这 种 类 型 的 音频 至 少 
为 1.411 Mbps。 所 以 如 果 没 有 压缩 ， 它 是 不 能 送 到 因特网 上 去 的 。MP3 ( MPEG 第 三 代 音 频 
压缩 格式 ) (MPEG 标准 的 一 部 分 ， 在 视频 压缩 小 节 中 讨论 过 ) 使 用 的 就 是 这 种 技术 。 

感知 编码 是 基于 心理 声学 的 ， 心 理 声学 是 一 门 研究 人 类 是 如 何 感 知 声 音 的 科学 。 想 法 是 
基于 我 们 听觉 系统 的 瑕 痘 ， 有 些 声 音 能 够 掩盖 其 他 声音 。 掩 盖 可 以 发 生 在 频率 上 和 时 间 上 。 
在 频率 掩盖 中 ， 一 个 频率 范围 的 高 的 声音 可 以 部 分 或 完全 掩盖 另 一 个 频率 范围 的 低 的 声音 
例如 ， 在 一 个 有 高 音 重 金属 演出 的 房间 内 ， 我 们 就 不 能 听见 我 们 舞伴 的 说 话 声 。 在 时 间 拉 
中 ， 一 个 高 音 可 以 短 时 间 内 降低 我 们 听觉 的 灵敏 度 ， 甚 至 在 声音 停止 之 后 。 

MP3 使 用 这 两 种 现象 (频率 掩盖 和 时 间 掩 盖 ) 来 压缩 音频 信号 。 该 技术 分 析 音 谱 并 把 音 
谱 分 成 几 个 组 。0 位 被 赋 给 了 那些 频率 范围 被 完全 掩盖 的 ， 小 数值 的 位 被 赋 给 了 那些 频率 范 
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围 部 分 被 掩盖 的 。 大 数值 的 位 被 赋 给 了 那些 不 被 掩盖 的 。 | 
MP3 有 三 种 速率 : 96 kbps、128 kbps 和 160 kbps。 速 率 是 基于 原始 模拟 音频 的 频率 范 


围 的 。 
15.4 


章 末 材料 


推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书 籍 : 


15.5 


小 测验 


Drozdek, A. Elements of Data Compression, Boston, MA: Course Technology, 2001 
Symes, P. Video Compression, New York: McGraw-Hill, 1998 

Haskell, B., Puri, A. and Netravali, A. Digital Video: An Introduction to MPEG?2, New 
York: Chapman & Hill, 1997 

Pennebaker, W. and Mitchell, J. JPEG Still Image Data Compression Standard, New 
York: Van Nostrand Reinhold, 1993 


数据 压缩 方法 分 为 无 损 压 缩 (所 有 信息 都 可 恢复 ) 和 有 损 压 缩 (部 分 信息 丢失 )。 

在 无 损 压 缩 方法 中 ， 接 收 的 数据 是 发 送 数 据 的 完全 复制 。 三 种 无 损 压 缩 方法 分 别 是 
游程 长 度 编码 、 赫 夫 曼 编码 和 LZ 编码 。 

在 游程 长 度 编码 中 ， 重 复出 现 的 符号 被 该 符号 和 表示 该 符号 重复 的 数字 所 替换 。 

在 赫 夫 曼 编码 中 ， 编 码 的 长 度 是 符号 频率 的 函数 ; 出 现 频率 越 高 的 符号 相对 于 出 现 
频率 较 低 的 符号 编码 长 度 越 短 。 

在 LZ 编码 中 ， 重 复 的 字符 串 或 字 以 变量 形式 保存 。 字 符 串 或 字 用 变量 的 索引 号 代 
替 。LZ 编码 在 接收 方 和 发 送 方 都 需要 一 个 字典 和 一 个 算法 。 

在 有 损 压 缩 中 ， 接 收 的 数据 并 不 需要 是 所 发 送 数据 的 完全 复制 。 本 章 讨论 的 三 种 有 
损 压 缩 方 法 分 别 是 JPEG、MPEG 和 MP3。 

联合 图 像 专家 组 (JPEG) 是 一 种 用 来 压缩 图 形 和 图 像 的 方法 。JPEG 过 程 包括 划分 块 、 
离散 余弦 变换 、 量 化 以 及 无 损 压 缩 。 

运动 图 像 专 家 组 (MPEG) 是 一 种 用 来 压缩 视频 的 方法 。MPEG 包括 空间 和 时 间 压 缩 。 
前 者 和 JPEG 相似 ， 后 者 则 去 掉 了 多 余 的 帧 。 

MPEG 第 三 代 音 频 压 缩 格式 (MP3 ) 是 MPEG 标准 的 一 部 分 。MP3 使 用 感知 编码 技 
术 压 缩 CD 质量 音频 。 


练习 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 继续 本 章 习 题 前 首先 
完成 相关 测验 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 数据 压缩 方法 有 哪 两 种 类 别 ? 
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2. 无 损 压 缩 和 有 损 压 缩 有 什么 不 同 ? 

3. 什么 是 游程 长 度 编 码 ? 

4. LZ 编码 方法 是 怎样 减少 需要 传输 的 位 的 数量 的 ? 
5. 什么 是 赫 夫 曼 编码 ? 

6. 字典 在 LZ 编码 中 担当 什么 角色 ? 

7. 相对 于 赫 夫 曼 编码 ，LZ 编码 的 优点 是 什么 ? 

8. 有 损 压 缩 的 三 种 方法 是 什么 ? 

9. 什么 时 候 用 JPEG 格式 ， 什 么 时 候 用 MPEG 格式 ? 
10. JPEG 和 MPEG 有 什么 关系 ? 

11. 在 JPEG 格式 中 分 块 有 什么 作用 ? 

12. 在 JPEG 格式 中 为 什么 需要 离散 余弦 变换 ? 

13. 量化 对 于 数据 压缩 有 何 贡 献 ? 

14. 在 MPEG 压缩 中 什么 是 帧 ? 

15. 相对 于 时 间 压 缩 而 言 空间 压缩 是 什么 ? 

16. 讨论 MPEG 格式 中 三 种 不 同类 型 的 帧 。 


练习 题 


1. 对 下 面 的 位 模式 使 用 游程 长 度 编码 方式 进行 编码 ， 编 码 长 度 为 5 位 。 
18 个 0、11、56 个 0、1、15 个 0、11 
2. 对 下 面 的 位 模式 使 用 游程 长 度 编码 方式 进行 编码 ， 编 码 长 度 为 5 位 。 
1、8 个 0、1、45 个 0、11 
3. 对 下 面 给 定 频 率 的 字符 进行 赫 夫 曼 编 码 。 
A(12)、B(8)、C(9)、D(20)、E(31)、F(14)、G(8) 
4. 对 下 面 字 符 使 用 赫 夫 曼 编码 ， 每 一 个 字符 有 相同 的 频率 ( 1 )。 
A、 B.C.D, E. F. G. H、 I、J 
5. 下 面 是 赫 夫 曼 编 码 吗 ? 请 解释 。 
A:0 B:10 C:1l 
6. 下 面 是 赫 夫 曼 编码 吗 ? 请 解释 。 
A:0 B:1 C:00 D:01 E:10 F:1l 
7. 对 字符 串 BAABBBBAACAA 使 用 下 面 的 赫 夫 曼 编码 进行 编码 。 
A:0 B:10 C:11 
8. 使 用 下 面 的 赫 夫 曼 编 码 对 0101000011110 进行 译 码 。 
A:0 B:10 C:1l1 
9. 使 用 Lempel Ziv 方 法 对 信息 BAABBBBAACAA 进行 编码 ， 然 后 对 编码 消息 进行 译 码 ， 得 到 
源码 。 
10. 如 果 字 典 包含 ABB ， 使 用 Lempel Ziv 方法 对 字符 串 AAAABBCCCBBB( 消 息 的 一 部 分 ) 进行 编码 ， 
并 显示 字典 的 最 终 内 容 。 
. DCT 的 求 值 需要 大 量 的 计算 ,通常 是 由 计算 机 程序 来 进行 的 ， 不 用 DCT 而 使 用 下 列 规则 转换 一 
个 2X2 的 表 : 
7(0, 0) = (1/16)[P(0, 0) + P(0, 1) + P(1, 0) + P(1, 1)] 
7(0, 1) = (1/16)[0.95P(0, 0) + 0.9P(0, 1) + 0.85P(1, 0) + 0.80P(1, 1)] 
7T(1, 0) = (1/16)[0.90P(0, 0) + 0.85P(0, 1) + 0.80P(1, 0) + 0.75P(1, 1)] 
7T(1, 1) = (1/16)[0.85P(0, 0) + 0.80P(0, 1) + 0.75P(1, 0) + 0.70P(1, 1)] 
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如 果 P(0, 0)=64, P(0, 1)=32,P(1, 0)=128,P(1, 1)=148, 求 7(0, 0)、7(0, 1)、7T(1, 0) 和 7(1, 1)。 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ,我们 编写 了 一 些 Java 的 小 程序 。 强 烈 建 议 学 生 通过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨论 材料 的 理解 。 


| 第 16 章 


Foundations of Computer Science, Third Edition 


安 全 





安全 这 个 话题 很 宽泛 并 且 包括 数学 中 的 某 些 特定 领域 ， 比 如 数论 。 本 章 尝试 简单 地 介绍 
这 一 话题 ， 并 为 深入 学 习 准 备 背景 知识 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

e 定义 安全 目标 、 攻 击 类 型 和 网 络 安 全 提供 的 服务 ; 

。 定义 两 种 提供 安全 服务 的 技术 : 密码 术 和 隐 写 术 ; 

e 定义 安全 的 第 一 个 目标 ， 机 密 性 ; 

e 区 分 对 称 密 钥 密码 和 非 对称 密 钥 密码 以 及 它们 的 应 用 ， 并 理解 我 们 同时 需要 这 两 种 

技术 : 对 称 密 钥 密码 适用 于 长 消息 ， 非 对 称 密 钥 密码 适用 于 短 消息 ; 

e 描述 安全 的 其 他 领域 : 消息 完整 性 、 消 息 验证 、 数 字 签 名 ， 实 体验 证 和 密 钥 管理 ; 

e 理解 消息 完整 性 和 消息 验证 是 如 何 得 到 的 ; 

。 理解 消息 验证 和 实体 验证 之 间 的 区 别 ; 

。 了 解 对 称 密 钥 和 非 对 称 密 钥 在 通信 中 的 实体 之 间 是 如 何 分 布 的 ; 

e 理解 防火 墙 在 防止 有 害 消息 到 达 一 个 系统 中 的 作用 。 


16.1 引言 


我 们 生活 在 信息 时 代 ， 需 要 保存 生活 中 各 方面 的 信息 。 换 名 话说 ,信息 是 一 种 有 价值 的 
资产 ， 就 像 其 他 资产 一 样 。 作 为 一 种 资产 ， 信 息 需 要 保护 ， 免 受 攻击 。 为 了 安全 ， 信 息 需要 
避 开 未 授权 的 使 用 (机密 性 )， 保护 信 息 不 受到 未 授权 的 算 改 (完整 性 )， 并 且 对 于 得 到 授权 
的 实体 来 说 是 需要 时 可 用 的 (可 用 性 )。 

在 过 去 30 年 间 ， 计 算 机 网 络 已 经 在 信息 的 使 用 上 创造 了 一 场 革命 。 现 在 的 信息 是 分 
散 的 。 被 授权 的 人 可 以 通过 计算 机 网 络 远 距 离 地 发 送 和 检索 信息 。 虽 然 以 上 提 到 的 三 个 要 
求 一 一 机 密 性 、 完 整 性 和 可 用 性 没有 改变 ,但 它们 现在 包括 了 一 些 新 的 内 容 。 信 息 不 仅仅 应 
该 在 存储 时 保密 ， 在 它 从 一 台 计 算 机 传输 到 另 一 台 计算 机 时 也 是 有 办 法 保持 机 密 性 的 。 

这 一 节 中 ， 我 们 先 讨 论 信息 安全 的 三 个 主要 目标 ， 然 后 将 探索 攻击 是 如 何 威胁 这 三 个 目 
标的 。 然 后 我 们 将 讨论 和 这 些 安全 目标 有 关 的 安全 服务 ， 最 后 我 们 将 定义 两 个 实现 安全 目标 
并 且 防 止 攻击 的 技术 。 


16.1.1 安全 目标 


我 们 将 首先 讨论 三 个 安全 目标 : 机 密 性 、 完 整 性 和 可 用 性 。 

1. 机 密 性 

机 密 性 也 许 是 信息 安全 中 最 通常 的 方面 。 我 们 需要 保护 机 密 信 息 ， 需 要 一 个 组 织 来 看 护 
这 些 信 息 ， 以 防 那些 危及 到 信息 机 密 性 的 恶意 行为 。 机 密 性 不 仅仅 适用 于 信息 的 存储 ， 在 信 
息 的 传输 中 它 也 得 到 了 应 用 。 当 我 们 将 一 小 段 信息 发 送 并 存储 至 远程 计算 机 或 从 远程 计算 机 
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上 检索 一 段 信 息 时 ， 需 要 在 传输 时 对 该 信息 进行 隐藏 。 

2. 完整 性 

信息 需要 不 停 地 变化 。 在 一 个 银行 中 ， 当 一 个 客户 存 钱 或 取 钱 时 ， 他 的 账户 余额 需要 
改变 。 完 整 性 的 意思 是 变化 只 应 该 由 授权 的 实体 通过 授权 的 机 制 来 完成 。 完 整 性 冲突 不 一 
定 是 由 于 恶意 行为 造成 的 ， 它 也 可 能 是 系统 中 断 (例如 短路 ) 造成 的 对 信息 的 一 些 不 希望 
的 改动 。 

3. 可 用 性 

信息 安全 的 第 三 个 部 分 是 可 用 性 。 一 个 组 织 创建 和 存储 的 信息 对 授权 实体 来 说 应 该 是 
可 用 的 。 如 果 信 息 是 不 可 用 的 ， 那 它 就 是 无 用 的 。 信 息 需 要 时 常 改变 ， 这 就 意味 着 它 必须 对 
那些 被 授予 访问 权限 的 实体 是 可 以 访问 的 。 信 息 的 不 可 用 性 对 组 织 是 有 害 的 ， 就 像 缺 乏 信息 
的 机 密 性 和 完整 性 一 样 。 想 象 一 下 ， 如 果 客 户 交 易 时 不 能 访问 他 们 的 账户 ， 这 时 银行 会 发 生 
什么 。 


16.1.2 攻击 


三 个 安全 目标 (机 密 性 、 完 整 性 和 可 用 性 ) 会 受到 安全 攻击 的 威胁 。 虽 然 文献 中 可 能 采 
用 不 同 的 方法 来 对 攻击 进行 分 类 ， 但 我 们 在 这 里 将 它们 按照 安全 目标 分 为 三 类 。 图 16-1 显 
示 了 该 分 类 。 









拒绝 服务 | 


对 可 用 性 的 威胁 


对 完整 性 的 威胁 


图 16-1 与 安全 目标 有 关 的 攻击 分 类 
1. 威胁 机 密 性 的 攻击 
通常 有 两 种 攻击 威胁 到 信息 的 机 密 性 : 嗅 探 和 流量 分 析 。 
(1 ) 嗅 探 


嗅 探 是 指 对 数据 的 非 授权 访问 或 侦 听 。 例 如 ， 一 个 通过 因特网 传输 的 文件 可 能 含有 机 密 
的 信息 ， 一 个 非 授 权 的 实体 可 能 侦 听 到 传输 ， 并 为 了 自己 的 利益 使 用 其 中 的 内 容 。 为 了 防止 
嗅 探 ， 可 以 使 用 我 们 下 面 要 讨论 的 加 密 技 术 ， 以 使 得 数据 对 侦 听 者 来 说 难以 理解 。 

(2 ) 流量 分 析 

虽然 通过 加 密 技术 我 们 可 以 使 得 数据 对 侦 听 者 来 说 难以 理解 ， 但 他 们 仍然 可 以 通过 在 线 
流量 监控 收集 其 他 类 型 的 信息 。 例 如 ， 他 们 能 找到 发 送 者 或 接收 者 的 电子 地 址 (如 电子 邮件 
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地 址 )， 收 集 多 对 请 求 和 响应 ， 帮 助 猜测 交易 的 本 质 。 

2. 威胁 完整 性 的 攻击 

数据 的 完整 性 会 受到 多 种 攻击 的 威胁 : 答 改 、 假 冒 、 重 放 和 抵赖 。 

(1 ) 算 改 

侦 听 或 访问 信息 后 ， 攻 击 者 自 改 信息 ， 使 得 信息 有 利于 他 们 。 例 如 ， 一 个 客户 可 能 向 银行 
发 送 一 消息 去 完成 一 些 交易 。 攻 击 者 侦 听 到 信息 ， 并 为 了 自己 的 利益 自 改 了 交易 的 类 型 。 注 
意 ， 有 时 攻击 者 可 能 仅仅 是 删除 或 延迟 了 这 个 消息 来 危害 这 个 系统 或 者 使 他 们 自己 受益 。 

(2 ) 假冒 

当 攻 击 者 冒充 其 他 人 时 ， 假冒 或 “哄骗 ”就 发 生 了 。 例如， 一 个 攻击 者 可 能 盗窃 银行 卡 
和 银行 客户 的 PIN 而 假装 是 这 个 客户 。 有 时 攻击 者 则 假冒 接收 实体 。 比 如 ， 一 个 用 户 尝试 
联系 一 家 银行 ,但 是 另 一 个 站 点 伪装 成 银行 网 站 并 从 用 户 那 里 得 到 了 一 些 信息 。 

(3 ) 重 放 

重 放 是 另 一 种 类 型 的 攻击 。 攻 击 者 得 到 用 户 发 送 的 消息 的 副本 ， 过 后 设法 重 放 它 。 例 
如 ， 一 个 客户 向 他 的 银行 发 送 了 一 条 给 攻击 者 付款 的 请 求 ， 攻 击 者 侦 听 到 这 个 消息 ， 再 次 发 
送 这 条 消息 ， 想 从 银行 得 到 另 一 次 付款 。 

(4 ) 抵赖 

抵赖 是 一 种 不 同 于 其 他 类 型 的 攻击 ， 因 为 它 是 由 通信 双方 中 的 一 个 来 进行 的 : 发 送 者 或 
接收 者 。 消 息 的 发 送 者 后 来 可 能 抵赖 他 发 送 了 消息 ; 消息 的 接收 者 后 来 也 可 能 抵赖 他 接收 到 
消息 。 一 个 发 送 者 抵赖 的 例子 可 能 如 ， 一 个 银行 客户 要 求 银 行 给 第 三 方 送 钱 ， 但 后 来 他 否认 
自己 做 过 这 样 的 请 求 。 一 个 接收 者 抵赖 的 例子 可 能 如 ， 某 人 向 一 制造 商 购 买 产品 ， 并 电子 付 
款 ， 但 制造 商 后 来 否认 已 经 收 到 付款 而 要 求 再 付 。 

3. 威胁 可 用 性 的 攻击 

我 们 在 这 里 只 讨论 一 种 威胁 可 用 性 的 攻击 : 拒绝 服务 。 

拒绝 服务 

拒绝 服务 (DoS ) 攻击 是 很 常见 的 ， 它 可 能 减 慢 或 完全 中 断 系 统 的 服务 。 攻 击 者 能 使 用 
几 种 策略 取得 这 样 的 效果 。 他 们 可 能 通过 发 送 大 量 虚假 请 求 使 系统 变 得 非常 忙碌 而 月 演 ， 或 
他 们 可 能 侦 听 并 删除 服务 器 对 客户 端的 响应 ， 使 客户 端 相 信服 务 器 未 响应 。 攻 击 者 也 通过 侦 
听 客 户 端的 请 求 ， 使 得 客户 端 多 次 发 送 请 求 导 致 系统 变 得 非常 忙碌 。 


16.1.3 ”服务 和 技术 


为 了 达到 安全 目标 和 防止 安全 攻击 ，ITU-T 定义 了 一 些 安 全 服务 的 标准 。 这 些 服务 中 的 
每 一 个 都 是 为 了 在 维护 安全 目标 时 防止 一 个 或 多 个 攻击 而 设计 的 。 实 际 完成 安全 目标 需要 一 
些 技术 手段 ， 现 今 流行 两 种 技术 : 一 种 是 非常 普通 的 密码 术 ; 一 种 是 特殊 的 隐 写 术 。 

1. 密码 术 

有 些 安全 服务 可 以 使 用 密码 术 来 实现 。 密 码 术 (希腊 起 源 的 单词 ) 意思 是 “秘密 书写 ”。 
但 是 ,我 们 使 用 这 个 词 是 指 为 使 消息 安全 并 对 攻击 免疫 而 进行 转换 的 科学 和 艺术 。 虽 然 在 过 
去 密码 术 只 是 指使 用 密 钥 进行 消息 的 加 密 和 和 解密， 但 如 今 它 被 定义 成 三 种 不 同 的 机 制 ， 对 称 
密 钥 密码 、 非 对 称 密 钥 密 码 和 散 列 。 本 章 稍 后 会 讨论 这 三 种 机 制 。 

2. 隐 写 术 

虽然 本 章 和 接 下 来 的 部 分 以 密码 术 作 为 实现 安全 机 制 的 一 种 技术 ,但 另 一 种 过 去 用 于 秘 
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密 通信 的 技术 现在 正在 复苏 ， 它 就 是 隐 写 术 。 单 词 隐 写 术 (起 源 于 希腊 语 ) 意思 是 “掩饰 书 
写 ”， 而 对 应 的 密码 术 的 意思 是 “秘密 书写 ”。 密 码 术 就 是 通过 加 密 把 消息 中 的 内 容 隐 藏 起 
来 ; 而 隐 写 术 是 通过 在 消息 上 覆盖 其 他 内 容 而 隐藏 消息 。 隐 写 术 的 具体 内 容 将 留 给 该 话题 的 
其 他 书籍 讨论 。 
16.2 ”机 密 性 

现在 我 们 来 看 第 一 个 安全 目标 ， 机 密 性 。 机 密 性 可 以 通过 使 用 密码 达到 。 密 码 术 可 以 分 
成 两 大 类 : 对 称 密 钥 密码 术 和 非 对 称 密 钥 密码 术 。 
16.2.1 ”对 称 密 钥 密码 术 


对 称 密 钥 密码 术 使 用 了 同一 个 密 钥 进 行 加 密 和 解密 ， 并 且 这 个 密 钥 可 以 用 来 进行 双向 通 
信 ， 这 就 是 为 什么 它 被 称 为 对 称 的 。 图 16-2 显示 了 对 称 密 钥 密码 术 的 基本 思想 。 


安全 密 钥 交 换 信 道 


不 安全 信和 得 





图 16-2 对称 密 钥 密 码 术 的 基本 思想 


对 称 密 钥 密码 术 也 称 为 保密 密 钥 密码 术 。 人 

在 图 16-2 中 ，Alice 通过 一 个 不 安全 的 通道 向 Bob 发 送 一 则 消息 ， 假设 一 个 敌手 Be 在 
通道 上 简单 地 偷 听 ， 但 她 不 能 理解 消息 的 内 容 。 

从 Alice 到 Bob 的 原始 消息 称 为 明文 ， 而 通过 通道 发 送 的 消息 称 为 密 文 。 为 了 从 明文 创 
建 密 文 ，Alice 使 用 了 一 个 加 密 算法 和 一 个 共享 的 密 钥 。 

为 了 从 密 文 创建 明文 ，Bob 使 用 了 一 个 解密 算法 和 一 个 相同 的 密 钥 。 我 们 把 加 密 和 解密 
算法 称 为 密码 。 密 钥 是 密码 (一 个 算法 ) 操作 中 的 一 组 值 (数字 )。 

注意 ， 对 称 密 钥 加 密 对 加 密 和 解密 使 用 一 个 密 钥 ( 密 钥 本 身 可 以 是 一 串 数 值 )。 此 外 ， 
加 密 算 法 和 解密 算法 是 互 道 的 。 如 果 己 为 明文 ，C 是 密 文 ,，K 是 密 钥 ， 加 密 算法 Ex(x) 从 明 
文 建立 了 密 文 ， 而 解密 算法 Dx(x) 从 密 文 建立 了 明文 。 我 们 推断 Ex(x) 和 Dx(x) 是 互 逆 的 : 
如 果 对 一 个 输入 依次 施加 Ex(x) 和 Dx(x)， 它 们 的 作用 会 相互 抵消 。 我 们 有 : 

加 密 : C=Ex(P) 解密 : P=Dx(C) 

在 这 里 ，Dx(Ex(x))= Ex(Dx(x)) =x。 需 要 强调 的 是 ， 最 好 可 以 将 加 密 和 人 解密 算法 公开 但 
是 把 共享 密 钥 保密 。 这 意味 着 Alice 和 Bob 需要 另外 一 个 (安全 的 ) 通道 来 交换 密 钥 。Alice 
和 Bob 可 能 会 面 ， 亲 自 交换 密 钥 ， 这 里 的 安全 通道 就 是 面对面 交换 密 钥 。 他 们 也 可 以 相信 
第 三 方 给 他 们 的 相同 的 密 钥 ， 或 者 他 们 可 以 使 用 另外 一 种 密码 ( 非 对 称 密 码 ， 我 们 后 面 会 谈 
到 ) 来 建立 临时 的 密 钥 。 

加 密 可 以 看 作 把 消息 锁 进 箱子 ， 而 解密 可 以 看 成 打开 箱子 。 在 对 称 密 钥 加 密 中 ， 用 相同 
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的 密 钥 来 锁 和 打开 “箱子 ”， 如 图 16-3 所 示 。 在 下 一 人 
个 密 钥 ， 一 个 用 于 上 锁 而 另 一 个 则 用 于 开锁 。 

我 们 可 以 把 对 称 密 钥 密码 分 成 两 大 类 : 传统 对 称 密 钥 
密码 和 现代 对 称 密 钥 密码 。 传 统 密码 很 简单 ， 面 向 字符 的 1 
密码 对 现在 的 标准 而 言 是 不 安全 的 。 另 一 方面 ， 现 代 密码 Te 
是 更 为 安全 的 复杂 的 面向 位 的 密码 。 我 们 将 简单 讨论 传统 同一 个 刻 钥 上 锁 和 开锁 
密码 为 讨论 更 复杂 的 现代 密码 做 铺垫 。 

1. 传统 对 称 密 钥 密码 

传统 密码 属于 过 去 。 然 而 ， 因 为 它们 可 以 理解 为 是 现代 密码 的 构成 要 素 ， 所 以 我 们 在 这 
里 对 其 进行 简要 讨论 。 更 确切 地 说 ， 我 们 把 传统 密码 分 为 替换 密码 和 移 位 密码 。 

(1 ) 替换 密码 

替换 密码 用 一 个 符号 替换 另 一 个 符号 。 如 果 在 明文 中 的 符号 是 字母 表 的 字符 ， 我 们 用 另 
一 个 字符 来 代替 。 例 如 ， 我们 能 用 字母 D 代替 字母 A， 用 字母 Z 代替 字母 T。 如 果 符 号 是 
数字 (0 一 9 ), 我们 能 用 7 代替 3, 用 6 代替 2。 

蔡 换 密码 就 是 用 一 个 符号 替代 另 一 个 符号 。 

替换 密码 主要 可 以 分 成 单字 母 密码 和 多 字母 密码 。 

(2 ) 单字 母 密码 

在 单字 母 密码 中 ， 明 文中 相同 的 字符 (或 符号 ) 在 密 文中 用 相同 的 字符 (或 符号 ) 替换 ， 
与 该 字符 在 明文 中 的 位 置 无 关 。 例 如 ， 如 果 算 法 定义 将 明文 中 所 有 的 字母 A 都 替代 成 为 字 
母 D,， 那么 所 有 的 字母 A 都 将 换 成 字母 D。 换 名 话说， 明文 和 密 文中 的 字符 关系 是 一 一 对 
应 的 。 

最 简单 的 单字 母 密码 就 是 加 法 密码 (或 者 移 位 密码 )。 假 设 明文 由 小 写字 母 (a 一 z) 构 
成 ， 密 文中 包括 大 写字 母 (A ~ Z), 为 了 使 数学 的 计算 操作 可 以 施加 在 明文 和 密 文 上 ， 我 们 
向 每 一 个 字母 (无论 大 小 写 ) 都 进行 赋值 ， 如 图 16-4 所 示 。 
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图 16-4 模 26 中 明文 和 密 文字 符 的 表示 


在 图 16-4 中 ， 每 一 个 字母 (无论 大 小 写 ) 都 赋予 了 一 个 模 26 中 的 整数 。Alice 和 Bob 
之 间 的 密 钥 也 是 模 26 中 的 一 个 整数 。 加 密 算法 将 密 钥 加 上 明文 字符 ， 解 密 算法 从 密 文字 符 
上 减 去 密 钥 得 到 明文 。 所 有 操作 都 在 模 26 中 完成 。 

在 加 法 密码 中 ， 了 明文、 密 文 和 密 钥 都 是 模 26 中 的 整数 。 

历史 上 ， 加 法 密码 也 被 称 为 移 位 密码 ， 原 因 是 加 密 算法 可 以 解释 成 “ 下 和 oy 才学 
符 ”， 而 解密 算法 可 以 解释 成 “向 上 移 位 key 个 字符 ”。 尤 利 乌 斯 .凯撒 (Julius Caesar) 与 
他 的 军官 是 使 用 密 钥 为 3 的 加 法 密码 进行 通信 的 。 正 是 由 于 这 个 原因 ， 加 法 密码 有 时 也 称 为 
凯撒 密码 。 

例 16.1 使 用 密 钥 为 15 的 加 法 密码 加 密 消息 “hello”。 

解 ” 我 们 对 明文 一 个 字符 一 个 字符 地 使 用 加 密 算法 : 


明文 : h 一 07 加 密 : (07+15) mod 26 密 文 : 22 一 W 
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明文 e 一 04 加 密 : (04+15) mod 26 密 文 : 19 一 了 
明文 : 1 一 11 加 密 : (11+15) mod 26 密 文 : 00 一 信 
明文 : 1 一 11 加 密 : (11+15) mod 26 密 文 : 00 一 人 
明文 : o 一 14 加 密 : (14+15) mod 26 密 文 : 03 一 D 


因此 密 文 是 “WTAAD”。 注 意 ， 这 个 密码 是 单字 母 的 ， 因 为 实例 中 两 个 相同 的 明文 字 
符 (1) 加 密 成 为 了 相同 的 字符 (A)。 

例 16.2 使 用 密 钥 为 15 的 加 法 密码 解密 消息 “WTAAD”。 

解 ” 我 们 对 密 文 一 个 字符 一 个 字符 地 使 用 解密 算法 : 


密 文 : W 一 22 加 密 : (22 一 15) mod 26 明文 : 07 一 h 
密 文 : T 一 19 加 密 : (19 一 15) mod 26 明文 : 04 一 e 
密 文 : R 一 00 加 密 ; (00 一 15) mod 26 明文 : 11 一 1 
密 文 : A 一 00 加 密 : (00 一 15) mod 26 明文 : 11 一 1 
密 文 : D 一 03 加 密 : (03 一 15) mod 26 明文 : 14 一 o 


因此 明文 是 “hello”。 注 意 ， 这 些 过 程 是 在 模 26 中 完成 的 ， 所 以 我 们 需要 向 一 个 负 值 
上 加 26 (例如 ，-15 变 成 11 )。 

(3 ) 多 字母 密码 

在 多 字母 密码 中 ， 字 符 的 每 一 次 出 现 都 使 用 不 同 的 替换 码 。 明 文中 字符 和 密 文 中 字符 
的 关系 是 一 对 多 ， 例 如,“a” 既 可 以 在 文本 开头 加 密 成 “D”， 也 可 以 在 中 间 加 密 成 “N”。 
多 字母 密码 具有 可 以 隐藏 原 有 语言 的 字母 频率 的 作用 ， 即 使 通过 单字 母 频率 统计 都 无 法 破解 
密 文 。 

为 了 创造 一 个 多 字母 密码 ， 我 们 对 每 一 个 密 文 字符 的 确定 都 不 仅 取 决 于 相对 应 的 明文 
字符 ， 还 与 该 明文 字符 在 原来 文本 中 的 位 置 有 关 。 这 意味 着 我 们 的 密 钥 应 该 是 子 密 钥 流 ， 这 
个 子 密 钥 流 中 的 每 一 个 子 密 钥 都 在 某 种 程度 上 取决 于 使 用 该 子 密 钥 进行 加 密 的 明文 字符 的 位 
置 。 换 名 话说， 我 们 需要 有 一 个 密 钥 流 k=(ki, 已, kh, …)， 在 这 里 厂 用 来 对 明文 中 第 i 项 的 字 
符 加密 并 创造 密 文中 的 第 i 项 字符 。 

为 了 更 好 地 解释 密 钥 的 位 置 依 赖 性 ， 我 们 先 讨论 一 个 叫做 自动 密 钥 密 码 的 简单 多 字母 密 
码 。 在 这 个 密码 中 ， 密 钥 是 一 个 子 密 钥 流 ， 在 这 个 子 密 钥 流 中 的 每 一 个 子 密 钥 都 用 来 对 明文 
文本 中 的 对 应 字符 进行 加 密 。 第 一 个 子 密 钥 是 Alice 和 Bob 事先 同意 并 秘密 设 定 的 值 ， 第 二 
个 子 密 钥 是 明文 中 第 一 个 字符 的 值 (在 0 一 25 之 间 )。 第 三 个 子 密 钥 是 第 二 个 明文 字符 的 值 ， 
以 此 类 推 。 

P=PiP2P3 … C=CiC2C3a… k= (ki, Pi1, P2, *…) 

加 密 :Ci=(Pi + Ki) mod 26 解密 :Pi= (Ci-ki) mod 26 

这 种 密码 的 名 字 “ 自 动 密 钥 密码 ”说 明了 这 些 子 密 钥 都 是 在 加 密 过 程 中 通过 明文 密码 字 
符 自动 创造 的 。 

例 16.3 假设 Alice 和 Bob 同意 使 用 一 个 初始 密 钥 值 为 好 12 的 自动 密 钥 密码 ， 现 在 
Alice 想 发 一 条 叫做 “ Attack is today” 的 消息 。 加 密 的 过 程 是 一 个 字符 接着 一 个 字符 进行 
的 ， 明 文中 的 每 一 个 字符 先 蔡 换 成 代表 它 的 整数 值 。 第 一 个 密 钥 和 第 一 个 明文 字符 的 整数 值 
相 加 以 得 到 第 一 个 密 文 字符 ， 剩 下 的 密 钥 在 阅读 明文 字符 时 产生 。 注 意 ， 由 于 明文 中 出 现 的 
3 个 “a” 和 3 个 “t” 都 是 通过 不 同方 式 加 密 的 ， 所 以 这 个 密码 是 多 字母 密码 。 

明文 a t t a ¢c k i s t oo d a y 

P 的 值 00 19 19 00 02 10 08 18 19 14 03 00 24 
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密 钥 流 12 00 19 19 00 02 10 08 18 19 14 03 00 

C 的 值 12 19 12 19 02 12 18 00 11 7 17 03 24 

密码 M TM TC MS AL HR DY 

(4 ) 移 位 密码 

移 位 密码 不 是 用 一 个 符号 代替 另 一 个 符号 ， 而 是 改变 符号 的 位 置 。 明 文 第 一 个 位 置 上 的 
符号 可 能 出 现在 密 文 的 第 十 个 位 置 上 ， 而 明文 第 八 个 位 置 上 的 符号 可 能 出 现在 密 文 的 第 一 个 
位 置 上 。 换 言 之 ， 移 位 密码 就 是 符号 的 重新 排序 。 

移 位 密码 就 是 符号 重新 排序 。 - i 

假设 Alice 需要 向 Bob 发 送 消息 “ Enemy attacks tonight”。 加 密 和 解密 的 过 程 见 图 16-5。 
注意 ， 我 们 在 消息 的 末尾 加 上 一 个 额外 的 字符 (z) 这 样 字 符 个 数 就 是 5 的 倍数 。 


Alice Bob 


4 明文 明文 
enemyattackstonightz enemyattackstonightz 







一 列 一 列 读 


ETTHEAKIMAOTYCNZNTSG 


图 16-5 移 位 密码 


第 一 张 表 是 Alice 通过 一 行 一 行 写 明文 创造 的 。 每 一 列 都 利用 同一 个 密 钥 进行 变更 。 密 
文通 过 一 列 一 列 读 第 二 张 表 得 到 。Bob 将 这 三 步 操作 反 向 进行 来 进行 解密 。 他 将 密 文 一 列 一 
列 写 人 第 一 张 表格 中 对 每 列 进行 变更 ， 然 后 一 行 一 行 读 第 二 张 表 。 注 意 ， 这 里 用 来 进行 加 密 
和 解密 的 密 钥 是 相同 的 ， 但 是 算法 使 用 密 钥 的 顺序 是 互 逆 的 。 

(5 ) 流 密码 和 分 组 密码 

文献 中 将 对 称 密码 分 为 两 大 组 : 流 密 码 和 分 组 密码 。 

〈6 ) 流 密码 

在 流 密 码 中 ， 加 密 和 解密 都 是 一 次 只 对 一 个 符号 〈 例 如 一 个 字符 或 位 ) 进行 。 我 们 有 一 
个 明文 流 、 一 个 密 文 流 和 一 个 密 钥 流 。 将 明文 流 称 为 P， 密 文 流 称 为 C， 密 钥 流 称 为 K。 


P=P1P2P3, *** C=C1CzsCar 汪 K= (ki, k2, K3, ***) 
C1=Exi (Pi) C2=Exz (P2) C3=Ex3 (P3) 
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(7 ) 分 组 密码 

在 分 组 密码 中 ,一 组 大 小 为 m (m>1l ) 的 明文 符号 被 加 密 在 一 起 ， 创 造 一 组 同样 大 小 的 
密 文 。 基 于 定义 ， 在 一 个 分 组 密码 中 ， 整 个 分 组 是 由 一 个 单独 的 密 钥 进 行 加密 ， 即 使 这 个 密 
钥 由 多 个 值 构成 。 在 分 组 密码 中 ， 密 文 的 分 组 取决 于 整个 明文 分 组 。 

(8 ) 组 合 

在 实际 操作 中 ， 每 个 明文 分 组 是 分 别 加 密 的 ， 但 是 同时 密 钥 流 被 用 来 对 整个 消息 按照 
分 组 依次 加 密 。 换 句 话说 ， 当 我 们 看 每 一 个 单独 分 组 时 ， 该 密码 是 分 组 密码 ， 但 是 从 整个 消 
息 来 看 ， 这 是 一 个 以 分 组 为 单位 进行 加 密 的 流 密码 。 每 个 分 组 都 使 用 一 个 不 同 的 密 钥 进行 加 
密 ， 这 些 密 钥 是 在 加 密 进 行 之 前 或 进行 过 程 中 产生 的 。 

2. 现代 对 称 密 钥 密 码 

我 们 到 现在 为 止 研 究 的 传统 对 称 密 钥 密码 都 是 面向 字符 的 密码 。 由 于 计算 机 的 进步 ， 我 
们 需要 面向 位 的 密码 。 这 是 由 于 需要 加 密 的 消息 已 经 不 仅仅 是 文本 ， 它 也 有 可 能 包括 数字 、 
图 表 、 音 频 和 视频 数据 。 在 这 个 情况 下 ， 更 方便 的 方法 是 把 这 些 类 型 的 数据 转换 成 比特 流 然 
后 再 对 流 进行 加 密 ， 然 后 发 送 加 密 后 的 流 。 除 此 之 外 ， 当 文本 在 比特 级 进行 处 理 时 ， 每 个 字 
符 会 替换 为 8 (或 16 ) 位 ， 这 也 意味 字符 数 也 变 成 了 原来 的 8 (或 16 ) 倍 大 。 将 更 多 的 字符 
混合 可 以 提高 安全 性 。 现 代 密 码 既 可 以 是 分 组 密码 也 可 以 是 流 密码 。 

(1 ) 现代 分 组 密码 

对 称 密 钥 现代 分 组 密码 对 大 小 为 n 位 的 明文 分 组 进行 加 密 或 对 同样 大 小 的 密 文 分 组 进行 
解密 。 加 密 或 解密 算法 使 用 位 的 密 钥 。 解 密 算法 必须 是 加 密 算法 的 逆 运 算 ， 并 且 两 个 操作 
必须 使 用 相同 的 密 钥 ， 这 样 Bob 可 以 检索 到 Alice 发 送 的 消息 。 图 16-6 显示 了 现代 分 组 密 
码 中 加 密 和 人 解密 的 大 体 思想 。 

当 消 息 的 长 度 小 于 nn 位 时 ， 消 息 后 会 加 
上 补丁 以 使 消息 长 度 达到 一 个 n 位 的 分 组 ; 
如 果 消 息 长 度 超过 位， 消息 就 会 被 分 成 几 
个 长 度 为 n 位 的 分 组 ， 如 果 必 要 ， 那么 相应 
的 补丁 会 添加 到 最 后 一 个 分 组 上 。n 的 常用 数 
值 是 64、128、256 和 512 位 。 图 16-6 ”现代 分 组 密码 

(2 ) 现代 流 密码 

除了 现代 分 组 密码 以 外 ， 我 们 也 可 以 使 用 现代 流 密码 。 现 代 流 密码 和 现代 分 组 密码 
的 差别 类 似 于 我 们 在 之 前 部 分 提 到 的 传统 的 流 密码 和 分 组 密码 之 间 的 差别 。 在 现代 流 密 码 
中 ， 加 密 和 人 解密 都 是 每 次 对 7 位 进行 。 我 们 有 一 个 表示 为 P=p,…pzpi 的 明文 流 ， 一 个 表示 为 
C=cn'**C2C1, 的 密 文 流 和 一 个 表示 为 K=k,*…* kk 的 密 钥 流 ; 在 这 里 pi、 Ci、 ki 都 是 长 度 为 r 位 
的 词 。 加 密 算法 是 c=E(k;，pi)， 解 密 则 表现 为 p=D(k:，ci)。 流 密码 比分 组 密码 更 快 ， 它 的 
硬件 实现 也 更 简单 一 些 。 当 我 们 需要 对 二 进 制 流 加 密 并 将 加 密 后 的 流 匀 速 传输 时 ， 流 密码 是 

一 个 更 好 的 选择 。 流 密码 对 于 传输 中 发 生 的 损毁 也 有 更 好 的 免疫 能 力 。 

最 简单 也 最 安全 的 同步 流 密码 是 吉尔 伯 特 * 弗 纳 姆 发 明 并 取得 专利 的 一 次 一 密 乱码 。 一 
次 一 密 乱码 每 次 加 密 时 使 用 随机 选择 的 密 钥 流 。 加 密 和 人 解密 都 使 用 单一 tt 
或 操作 的 性 质 ， 加 密 和 解密 的 算法 互 为 道 运算 。 有 一 点 需要 重视 的 是 ， 这 个 密码 中 的 异 或 操 
作 一 次 只 用 一 比特 。 同 样 需要 重视 的 是 Alice 还 需要 一 个 安全 通道 来 将 密 钥 流 序列 发 给 Bob 
(图 16-7 ) 。 
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图 16-7 一 次 一 密 乱码 


一 次 一 密 乱码 是 一 个 理想 化 的 密码 ， 它 很 完美 ， 不 仅 敌 手 无 法 猜测 密 钥 或 者 明文 与 密码 
的 统计 ， 明 文 和 密 文 之 间 也 没有 任何 联系 。 换 句 话说 ， 即 使 明文 有 某 种 规律 ， 密 文 仍 然 是 真 
正 的 比特 乱码 流 。 除 非 Eve 尝试 了 所 有 可 能 的 随机 密 钥 流 ， 她 不 可 能 强行 破解 这 个 密码 。 同 
时 ， 当 明文 的 长 度 为 n 位 时 ， 她 就 需要 尝试 2" 次。 然而 这 就 引申 出 了 一 个 问题 ， 每 次 当 发 
送 者 和 接收 者 交流 时 他 们 应 该 如 何 分 享 一 次 一 密 乱 码 密 钥 呢 ? 他 们 需要 通过 某 种 方法 在 随机 
密 钥 上 达成 共识 。 因 此 ， 这 个 完美 的 理想 密码 很 难 实现 。 不 过 ， 一 次 一 密 乱 码 也 有 一 些 可 行 
但 是 安全 性 较 低 的 版 本 ， 一 个 较 常 见 的 选择 叫做 反馈 移 位 寄存 器 (FSR)， 不 过 我 们 将 把 有 关 
这 个 有 趣 的 密码 的 讨论 留 给 主攻 安全 方面 话题 的 书籍 。 


16.2.2” 非 对 称 密 钥 密码 术 


前 一 节 讨论 了 对 称 密 钥 密码 。 本 节 将 开始 有 关 非 对 称 密 钥 密码 的 讨论 。 对 称 和 非 对 
称 密 钥 密码 平行 存在 着 并 继续 为 社区 服务 。 实 际 上 ， 我 们 相信 他 们 可 以 取长补短 ， 相 互 
补充 。 

从 概念 上 来 说 ， 这 两 种 系统 的 差别 在 于 它们 是 如 何 保守 秘密 的 。 在 对 称 密 钥 密码 术 中 ， 
密码 必须 在 双方 之 间 共 享 。 在 非 对 称 密 钥 密码 术 中 ， 秘 密 是 个 人 独 有 的 〈 非 共享 的 )， 每 个 
人 创造 并 保守 个 人 的 秘密 。 

在 有 nn 个 人 的 社区 中 ,n(n-1)/2 个 共享 的 秘密 需要 对 称 密 钥 密 码 术 来 完成 ， 如 果 只 有 
个 秘密 则 使 用 非 对 称 密 钥 密码 术 。 对 于 一 个 人 口 为 100 万 的 社区 来 说 ， 对 称 密 钥 密码 术 需 要 
500 万 个 共享 秘密 ， 而 非 对 称 密 钥 密码 术 只 需要 100 万 个 个 人 秘密 。 

对 称 密 钥 密码 术 基 于 共享 保密 ; 非 对 称 密 钥 密码 术 基 于 个 人 保密 。 

安全 性 在 加 密 以 外 还 有 其 他 方面 需要 非 对 称 密 钥 密 码 术 ， 这 些 方面 包括 身份 验证 和 数字 
签名 。 无 论 一 个 应 用 是 否 基于 个 人 秘密 ， 我 们 都 需要 使 用 非 对 称 密 钥 密码 术 。 

与 对 称 密 钥 密码 术 基 于 符号 (字符 或 位 ) 的 替换 和 排列 不 同 ， 非 对 称 密 钥 密 码 术 基于 数 
学 函数 在 数字 上 的 应 用 。 在 对 称 密 钥 密 码 术 中 ， 明 文 和 密 文 被 看 作 符号 的 组 合 ， 加 密 和 解密 
是 对 这 些 符 号 的 排列 或 相互 替换 。 在 非 对 称 密 钥 密 码 术 中 ， 明 文 和 密 文 都 是 数字 ， 加 密 和 和 解 
密 的 过 程 是 对 数字 应 用 数学 函数 并 创造 其 他 数字 的 过 程 。 

“对 称 密 钥 密码 术 对 字符 进行 排列 或 替换 ; 非 对 称 密 钥 密 码 术 对 数字 进行 操作 。 、 

在 非 对 称 密 钥 密码 术 中 使 用 两 个 分 开 的 密 铀 ， 私 钥 和 公 和 钥 。 如 果 把 加 密 和 解密 想象 成 是 
带 有 钥匙 的 挂 锁 的 锁 上 和 打开 ， 那么 用 公 钥 锁 上 的 挂 锁 只 能 被 相应 的 私 钥 打 开 。 图 16-8 中 
显示 如 果 Alice 用 Bob 的 公 钥 锁 上 挂 锁 ,那么 只 有 Bob 的 私 钥 才能 打开 它 。 

从 图 上 可 以 看 出 ， 非 对 称 密 钥 密码 术 和 对 称 密 钥 密码 术 不 同 的 地 方 在 于 它 使 用 不 同 的 密 
钥 : 私 钥 和 公 钥 。 虽 然 有 些 书 上 会 用 密 钥 代替 私 钥 ， 我 们 只 有 在 讨论 对 称 密 钥 密 码 术 时 使 用 
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图 16-8 非 对 称 密 钥 密 码 术 中 的 开锁 和 上 锁 


密 钥 ， 私 钥 和 公 钥 为 非 对 称 密 钥 密码 术 特 有 术语 。 我 们 甚至 使 用 不 同 的 符号 来 表示 这 三 种 密 
钥 ， 换 句 话 说 ， 这 是 为 了 说 明 密 铀 和 私 铀 是 不 可 互 换 的 ， 全 们 是 丙 科 吉 于 的 税 壮 。 

非 对 称 密 钥 密码 有 时 也 称 为 公 钥 密码 。 人 

1. 主要 思想 

图 16-9 展示 了 非 对 称 密 钥 密码 术 进 行 加 密 时 的 主要 思想 。 





图 16-9 非 对 称 密 钥 密码 术 进 行 加 密 时 的 主要 思想 


图 16-9 说 明 几 个 重要 的 事实 。 首 先 ， 它 强调 了 密码 系统 的 非 对 称 本 性 。 提 供 安全 的 重 
担 落 在 接收 者 的 肩 上 ， 这 里 是 Bob。Bob 需要 创建 两 个 密 钥 : 一 个 私 钥 和 一 个 公 钥 。 他 有 
义务 把 公 钥 分 发 给 团体 。 这 可 以 通过 公 钥 分 发 通道 来 完成 。 虽 然 此 通道 不 需要 保证 安全 ， 
但 它 必须 提供 身份 验证 和 数据 完整 性 。Eve 应 该 不 能 把 她 的 公 钥 假装 为 Bob 的 公 钥 公布 给 
团体 。 

其 次 ， 非 对 称 密 钥 密码 术 意 味 着 Bob 和 Alice 在 双向 通信 中 不 能 使 用 同一 组 密 钥 。 
在 通信 中 的 每 个 个 体 应 该 创建 自己 的 私 钥 和 公 钥 。 图 16-9 显示 了 Alice 使 用 Bob 的 公 
钥 ， 发送 加 密 消息 给 Bob。 如 果 Bob 需要 回应 ， 那 么 Alice 就 需要 建立 她 自己 的 私 钥 和 
公 和 钥 。 

再 次 ， 非 对 称 密 钥 密码 术 意 味 着 Bob 只 需要 一 个 私 钥 就 能 从 团体 中 的 任何 人 那里 接收 
信息 。 但 Alice 需要 7 个 公 钥 与 团体 中 的 2 个 人 进行 通信 ， 一 人 一 个 公 钥 。 总 之 ，Alice 需 
要 一 个 公 钥 环 。 

(1 ) 明文 / 密 文 

与 对 称 密 钥 密 码 术 不 同 ， 在 非 对 称 密 钥 密 码 术 中 ， 明 文 和 密 文 被 当 作 整 数 来 对 待 。 在 加 
密 之 前 ， 消 息 必 须 被 编码 成 一 个 整数 (或 一 组 整数 )， 在 解密 之 后 整数 (或 一 组 整数 ) 必须 译 
码 成 消息 。 非 对 称 密 钥 密码 术 通 常 被 用 来 加 密 或 解密 小 段 信 息 ， 例 如 对 称 密 钥 密码 术 中 的 密 
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码 密 钥 。 换 句 话 说 ， 非 对 称 性 密 钥 密码 术 通 常 起 到 辅助 目标 而 不 是 加 密 消息 的 作用 。 然 而 ， 
这 个 辅助 目标 在 当今 的 密码 术 中 发 挥 了 很 重要 的 作用 。 
非 对 称 密 钥 密码 术 通 常用 来 加 密 或 解密 小 段 信息 。 

(2 ) 加 密 /解密 

在 非 对 称 密 钥 密 码 术 中 的 加 密 和 解密 是 作用 在 表示 明文 和 密 文 的 数字 上 的 数学 函数 。 密 
文 可 以 被 看 成 C=f(Kpubvie*P)， 而 明文 可 以 看 成 P=g(Kprivae'C)， 其 中 解密 函数 1 只 用 来 加 密 ， 
而 解密 函数 g 只 用 来 解密 。 

(3 ) 两 个 系统 都 需要 

很 重要 但 有 时 会 被 误解 的 一 个 事实 是 : 非 对 称 密 钥 ( 公 钥 ) 密码 术 的 提 及 不 代表 着 对 对 
称 密 钥 (秘密 密 钥 ) 密码 术 需 求 的 减少 ， 因 为 需要 通过 数学 函数 进行 加 密 和 解密 的 非 对 称 密 
钥 密 码 术 比 对 称 密 钥 密 码 术 慢 得 多 。 对 称 密 钥 密 码 术 仍然 用 于 对 较 长 消息 的 加 密 。 在 另 一 方 
面 ， 对 称 密 钥 密码 术 的 速度 快 也 没有 减少 对 非 对 称 密 钥 密码 术 的 需求 。 身 份 验证 、 数 字 签 名 
和 秘密 密 钥 交换 仍然 需要 用 到 非 对 称 密 钥 密码 术 。 这 就 意味 着 ， 我 们 需要 将 对 称 密 钥 密 码 术 
和 非 对 称 密 钥 密 码 术 相互 配合 使 用 才能 使 用 到 当今 安全 性 的 每 一 个 领域 。 

2. RSA 密码 系统 

虽然 有 几 种 非 对 称 密 钥 密码 系统 ， 但 最 常用 的 公 钥 算法 之 一 是 RSA 密码 系统 (以 发 明 
者 Ron Rivest、Shamir 和 Adleman 命名 )。RSA 使 用 两 个 指数 e 和 dd， 其 中 e 是 公 铀 ，q& 是 
私 钥 。 假 设 己 代表 明文 而 C 代表 密 文 ， 那么 Alice 使 用 C=P* mod n 的 算法 从 明文 P 中 得 到 
密 文 C; Bob 通过 P=C?4 mod n 来 检索 Alice 发 送 的 明文 。 在 密 钥 生 成 的 过 程 中 创造 了 一 个 
很 大 的 数 作为 模 数 n。 

过 程 


图 16-10 展示 了 RSA 过 程 的 大 体 思想 。 





图 16-10 加密、 解密 和 RSA 中 的 密 钥 生成 


Bob 选择 了 两 个 素数 p 和 g， 计算 n=pXg 和 w=(p-1)X(g-1)。 然 后 Bob 选择 e 和 a， 
这 样 (exdg mod g=1。Bob 的 公 钥 是 n 和 e， 他 的 私 钥 是 4。 任 何人 ,包括 Alice， 都 可 以 
通过 C=P* mod n 加 密 一 条 消息 并 发 送 给 Bob， 而 Bob 则 通过 P=C* mod n 来 解密 消息 。 像 
Eve 这 样 的 窃听 者 无 法 在 pz 和 9 是 很 大 的 数字 时 破解 这 则 消息 (她 不 知道 4)。 

例 16.4 为 了 进行 示范 ，Bob 选 择 了 p=7 和 gq=11， 计算 出 n=7X11=77。 那 么 
9(n)=(7-1)(11-1),， 或 者 60。 如 果 他 把 e 选择 为 13， 那么 4 就 是 37。 注 意 ，eXd mod 60=1。 现 
在 假设 Alice 要 向 Bob 发 送 明 文 为 5 的 信息 。 她 使 用 公共 指数 13 来 加 密 明 文 5。 该 系统 不 
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是 安全 的 ， 因 为 p 和 9 很 小 。 


明文 : 5 


密 文 : 26 


C=513=26 mod 77 P=263"=5 mod 77 


密 文 : 26 


明文 : 5 


例 16.5 这 里 有 一 个 更 实际 的 通过 Java 计算 机 程序 进行 计算 的 例子 。 我 们 选择 一 个 
512 位 的 p 和 g， 计算 n 和 op(n)。 接 下 来 我 们 选择 一 个 e 并 且 计 算 4a。 最 后 我 们 展示 加 密 和 
解密 的 结果 。 整 数 p 是 一 个 159 位 数 的 数字 。 


p= 


96130345313583504574191581280615427909309845594996215822583 
15087964794045505647063849125716018034750312098666606492420 
191808780667421096063354219926661209 


整数 g 是 一 个 160 位 数 的 数字 。 


9 三 


12060191957231446918276794204450896001555925054637033936061 
79832173148214848376465921538945320917522527322683010712069 
5604602513887145524969000359660045617 


模 数 n=pXgq。 它 有 309 位 数 。 


n= 


115935041739676149688925098646158875237714573754541447754855 
261376147885408326350817276878815968325168468849300625485764 
11125016241455233918292716250765677272746009708271412773043 
49605005563472745666280600999240371029914244722922157727985 
317270338393813346926841373276220009666766718318310883734208 
23444370953 


p(n)=(p-1)(q-1) 有 309 位 数 。 


9(1D) = 


11593504173967614968892509864615887523771457375454144775485526137 
61478854083263508172768788159683251684688493006254857641112501624 
14552339182927162537656751054233608492916752034482627988117554787 
65701392344440571668658172819609822636107546721186461217135910735 
8640614008885170265377277264467341066243857664128 


Bob 选择 了 e=35 535 (最 理想 的 是 65 537 )， 然 后 得 到 d。 


e= 


d= 


35535 
580083028600377639360936612896779175946690620896509621804228661113 
805938528223587317062869100300217108590443384021707298690876006115 
306202524959884448047568240966247081485817130463240644077704833134 
010850947385295645071936774061197326557424237217617674620776371642 
0760033708533328853214470885955136670294831 


Alice 想 发 送 消 息 “ THIS IS A TEST”， 这 个 消息 可 以 通过 00-26 编码 表 (26 是 空格 符 ) 


改 成 一 个 数值 。 


P= 


190708182608182619041819 


Alice 的 密 文通 过 C= P* 计 算 ， 如 下 所 示 。 


G= 


47530912364622682720636555061054518094237179607049171652323924305 
44529606131993285666178434183591141511974112520056829797945717360 


冰 
> 
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36101278218847893741566090480023507190715277185914975188465888632 
10114835410336165789846796838676373376577746562507928052114814184 
404814184430812773059004692874248559166462108656 

Bob 可 以 利用 P= C" 将 原文 从 密 文 中 还 原 出 来 ， 如 下 所 示 。 


P= 190708182608182619041819 
解密 还 原 出 来 的 明文 是 “THIS IS A TEST”。 
3. 应 用 


虽然 RSA 可 以 用 于 对 实际 消息 进行 加 密 和 解密 ,但 如 果 消息 很 长 加 密 的 速度 会 很 慢 。 
因此 ，RSA 加 密 适 用 于 短 消息 。RSA 特定 用 于 数字 签名 以 及 其 他 不 需要 使 用 对 称 密 钥 来 对 
较 短 信息 进行 加 密 的 密码 。RSA 也 适用 于 身份 验证 ， 这 个 我 们 会 在 本 章 的 后 面 提 到 。 


16.3 ”其 他 安全 服务 


到 目前 为 止 我 们 研究 的 密码 系统 提供 了 机 密 性 ， 但 在 现代 通信 中 ， 还 需要 考虑 安全 的 其 
他 方面 ， 比 如 完整 性 、 消 息 和 实体 验证 、 不 可 抵赖 性 和 密 钥 管理 。 我 们 将 在 本 节 简 要 讨论 。 


16.3.1 消息 完整 性 


有 些 场合 我 们 可 能 不 需要 保密 ， 但 却 需要 完整 性 : 消息 应 该 是 不 受 改动 的 。 例 如 ，Alice 
可 能 写 一 份 遗 嘱 在 她 死 后 来 分 配 她 的 财产 ， 遗 嘱 不 需要 被 加 密 ， 她 死 之 后 ， 任 何人 能 检查 
它 , 但 是 遗嘱 的 完整 性 却 需 要 保证 。Alice 不 希望 遗嘱 的 内 容 在 她 不 知道 的 情况 下 被 算 改 。 

1. 消息 和 消息 摘要 

保证 文档 完整 性 的 一 种 方法 是 通过 使 用 指纹 。 如 果 Alice 需要 保证 她 的 文档 的 内 容 不 被 
算 改 ， 可 以 在 文档 的 底部 印 上 她 的 指纹 。 因 为 Eve 不 能 伪造 Alice 的 指纹 ， 所 以 Eve 不 能 自 
改 文档 的 内 容 或 创建 一 个 假 的 文档 。 为 了 确保 文档 没 被 算 改 过 ,文档 上 的 Alice 指纹 会 与 文 
件 中 的 Alice 指纹 进行 比较 。 如 果 不 同 ， 那 文档 就 不 是 来 自 Alice 的 。 文 档 和 指纹 对 的 电子 
等 价 物 就 是 消息 和 摘要 对 。 为 了 保证 消息 完整 性 ， 消 息 要 通过 一 个 称 为 密码 散 列 函数 的 算 
法 。 函 数 建立 消息 的 压缩 影像 ( 称 为 摘要 )， 这 个 影像 就 像 指 纹 一 样 使 用 。 为 了 检查 消息 或 
文档 的 完整 性 ，Bob 再 次 运行 密码 散 列 函数 ， 并 比较 新 摘要 与 之 前 的 摘要 ， 如 果 相同 ，Bob 
就 能 确保 原始 消息 没有 被 算 改 过 。 图 16-11 展示 了 该 思想 。 


非 安 全 通道 





图 16-11 消息 和 摘要 
两 对 (文档 /指纹 和 消息 / 消息 摘要 ) 是 相似 的 ， 但 有 一 些 区 别 。 文 档 和 指纹 在 物理 上 


290 侵 16 喝 





链接 在 一 起 。 消 息 和 消息 摘要 可 以 不 链接 (或 单独 发 送 ), 最 重要 的 是 消息 摘要 需要 保证 安 
全 ， 免 受 算 改 。 
消息 摘要 需要 保证 安全 ; 免 受 算 改 。 

2. 散 列 函数 

散 列 函数 将 任意 长 度 的 消息 加 密 成 为 固定 长 度 的 消息 摘要 。 所 有 的 散 列 函数 加 密 都 需要 
从 长 度 不 一 的 消息 中 创造 出 长 度 固定 的 消息 摘要 。 建 造 这 样 一 个 功能 最 好 由 迭代 完成 ， 创 造 
一 个 有 着 固定 输入 值 并 且 可 以 使 用 必需 的 次 数 的 函数 ， 而 不 是 使 用 输入 值 大 小 可 变 的 散 列 函 
数 。 这 里 的 固定 输入 值 函 数 指 的 是 压缩 函数 ， 它 将 n 位 的 一 捉 字 符 压 缩 并 创造 成 m 位 的 字 
符 串 ， 这 里 的 通常 大 于 m。 该 方案 被 称 为 近代 加 密 散 列 函 数 。 

罗 恩 . 李维斯 设计 的 几 个 散 列 算法 被 称 为 MD2、MD4 和 MD5， 这 里 的 MD 代表 消息 
摘要 。 最 新 的 版 本 (MD5 ) 是 MD4 的 一 个 加 强 版 ， 它 可 以 将 消息 分 成 长 度 为 512 位 的 分 组 
并 创造 大 小 为 128 位 的 摘要 。 然 而 ， 事 实证 明 大 小 为 128 位 的 消息 摘要 太 小 了 以 至 于 不 能 阻 
挡 攻 击 。 

因此 ， 为 了 回应 MD 散 列 算法 的 不 安全 性 ， 安 全 散 列 算法 诞生 了 。 安 全 散 列 算法 ( SHA) 
是 由 国家 标准 与 技术 研究 所 (NIST) 研制 的 一 个 标准 。SHA 经 过 了 几 个 版 本 。 


16.3.2 ”消息 验证 


消息 摘要 可 以 检验 消息 的 完整 性 ， 保 证 消息 没 被 算 改 。 为 了 确保 消息 的 完整 性 以 及 数 
据 源 的 身份 验证 一 一 这 消息 是 真 的 来 自 于 Alice 而 不 是 任何 其 他 的 人 ， 我 们 需要 在 过 程 中 包 
括 一 个 Alice 和 Bob 共享 的 秘密 (没有 经 过 Eve) ; 我 们 需要 创造 一 个 消息 验证 码 ( message 
authentication code，MAC)。 图 16-12 展示 了 这 个 思想 。 


M: 消息 
MAC | K: 一 个 共享 的 密 钥 
MAC: 信息 验证 码 


M+MAC 


非 安 全 通道 M+ MAC 





图 16-12 消息 验证 码 


Alice 使 用 散 列 函数 从 密 钥 和 消息 连接 中 创建 了 一 个 MAC， 即 h(K+M)。 她 在 不 安全 的 
通道 上 把 消息 和 MAC 发 送 给 Bob。Bob 把 消息 与 MAC 分 开 ， 然 后 从 消息 和 密 钥 的 连接 中 
建立 新 的 MAC， 然 后 比较 新 建 的 MAC 和 收 到 的 MAC， 如 果 两 个 MAC 匹配 ,那么 消息 就 
得 到 验证 ， 并 没有 被 敌手 算 改 过 。 

注意 在 这 种 情况 下 不 需要 使 用 两 条 通道 。 消 息 和 MAC 都 是 在 相同 的 不 安全 通道 上 发 送 
的 。Eve 可 以 看 见 消息 ， 但 她 不 能 伪造 一 个 新 的 消息 来 替换 ， 因 为 她 不 拥有 Alice 和 Bob 间 
的 密 钥 ， 她 不 能 像 Alice 一 样 创建 相同 的 MAC。 
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k 保 证 消息 的 完整 性 和 消息 验证 。 





MAC 通 ; 

HMAC 

国家 标准 与 技术 研究 所 (NIST) 发 布 了 新 一 代 MAC 标准 ， 通 常 称 为 HMAC ( 散 列 消息 
验证 码 )。HMAC 的 实施 比 简化 的 MAC 更 复杂 ， 因 此 本 书 不 包含 此 部 分 内 容 。 


16.3.3 ”数字 签名 


保证 消息 完整 性 和 消息 验证 (还 有 更 多 我 们 将 很 快 看 到 的 安全 服务 ) 的 另 一 种 方法 是 数 
字 签名 。 li 人 





我 们 大 家 都 熟悉 签名 这 个 概念 。 当 一 一 个 人 在 文档 上 签名 就 表示 该 文档 是 起 源 于 他 或 他 已 
同意 的 。 签 名 对 接收 者 来 说 是 文档 来 自 正确 实体 的 证 据 。 例 如 ， 当 客户 签 了 一 张 支票 ， 银 行 
就 需要 确信 支票 是 客户 签署 的 ， 而 不 是 其 他 人 。 换 言 之 , 文档 上 的 签名 是 身份 验证 的 标记 ， 
它 验 证 通过 ,文档 就 可 信 。 这 里 签名 概念 也 可 以 看 做 是 艺术 家 在 画 上 的 签名 ,艺术 上 的 签名 
如 果 得 到 验证 通过 ， 那 么 这 幅 画 通常 也 是 可 验证 通过 的 。 

当 Alice 向 Bob 发 送 消息 时 ，Bob 需要 检查 发 送 者 的 身份 ， 他 需要 确信 消息 来 自 Alice 
而 不 是 Eve。Bob 可 以 要 求 Alice 对 信息 进行 电子 签名 。 换 言 之 ,一 个 电子 签名 能 证 明 Alice 
作为 消息 发 送 者 的 身份 。 我 们 把 这 种 签名 称 为 数字 签名 。 

1. 对 比 

在 普通 签名 和 数字 签名 间 有 几 点 不 同 。 

(1) 包括 

普通 签名 是 包含 在 文档 里 的 ， 是 文档 的 一 部 分 。 当 我 们 写 支票 时 ， 签 名 就 在 支票 上 ， 而 
不 是 一 个 分 开 的 文档 。 但 是 当 对 文档 进行 数字 签名 时 ， 我 们 把 签名 作为 一 个 单独 的 文档 来 
发 送 。 

(2 ) 验证 手段 

两 种 签名 的 第 二 点 不 同 在 于 签名 验证 的 方法 不 同 。 对 于 普通 签名 ， 当 接收 者 接收 到 一 个 
文档 时 ， 他 们 比较 文档 上 的 签名 与 文件 中 的 签名 ,如果 相同 ,文档 就 是 可 信 的 。 接 收 者 需要 
有 一 个 文件 上 签名 的 副本 来 作 比 较 。 对 于 数字 签名 ， 接 收 者 接收 到 消息 和 签名 ， 签 名 的 副本 
不 再 保存 ， 接 收 者 需要 应 用 验证 技术 来 组 合 消息 和 签名 ， 从 而 验证 发 送 者 的 身份 。 

(3 ) 关系 

对 于 普通 签名 来 说 ， 签 名 和 文档 之 间 通 常 是 一 对 多 的 关系 ， 一 个 人 使 用 相同 的 签名 签署 
许多 文档 。 但 是 对 于 数字 签名 来 说 ， 签 名 和 消息 之 间 是 一 对 一 的 关系 。 每 条 消息 有 它 自 己 的 
签名 。 一 条 消息 的 数字 签名 不 能 用 在 另 一 条 消息 上 。 如 果 Bob 从 Alice 处 接收 到 两 条 消息 ， 
一 条 接着 一 条 ， 他 不 能 用 第 一 条 消息 的 签名 去 验证 第 二 条 。 每 条 消息 都 有 新 的 签名 。 

(4) 复制 性 

两 种 签名 的 另 一 点 不 同 是 称 为 复制 性 的 特质 。 普 通 签名 允许 签署 文档 的 副本 与 文件 中 
的 原始 件 有 点 不 同 。 对 于 数字 签名 ,就 没有 这 样 的 不 同 ， 除 非 在 文档 上 有 时 间 因 子 (如 时间 
截 )。 例 如 ， 假 设 Alice 发 送 文档 ， 指 示 Bob 给 Eve 付款 ， 如 果 Eve 截获 到 文档 和 签名 ， 她 
可 以 随后 重复 这 些 文档 和 签名 ， 再 次 从 Bob 处 得 到 钱 。 

2. 过 程 

图 16-13 显示 了 数字 签名 的 过 程 。 发 送 者 使 用 签名 算法 去 签署 消息 ， 消息 和 签名 被 发 送 
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给 接收 者 。 接 收 者 收 到 消息 和 签名 ， 对 收 到 的 内 容 应 用 验证 算法 ， 如 果 结 果 是 真 ， 消 息 被 接 
受 ， 和 否则 ， 消 息 被 拒绝 。 





图 16-13 ”数字 签名 过 程 


普通 签名 就 像 属于 文档 签署 者 的 私 钥 一 样 。 签 署 者 使 用 它 签署 文档 ， 没 有 其 他 人 能 有 这 
个 签名 。 文件 上 的 签名 副本 就 像 公 钥 ， 所 以 任何 人 都 能 使 用 它 通过 与 原始 签名 的 比较 来 验证 
文档 。 

对 于 数字 签名 ， 签 署 者 使 用 他 (或 她 ) 的 私 钥 (应 用 于 一 个 签名 算法 ) 去 签署 文档 。 另 
一 方面 ， 验 证 者 使 用 签署 者 的 公 钥 (应 用 于 一 验证 算法 ) 验证 文档 。 

注意 当 一 个 文档 被 签署 ， 任 何人 (包括 Bob) 都 能 验证 它 ， 因 为 任何 人 都 能 访问 Alice 
的 公 钥 。Alice 一 定 不 能 用 公 钥 去 签署 文档 ， 因 为 任何 人 都 能 伪造 她 的 签名 。 

我 们 能 和 否 用 一 个 密 钥 (对 称 的 ) 来 签署 和 验证 签名 ?答案 是 否定 的 ， 有 以 下 几 个 原因 。 
首先 ， 密 钥 是 只 有 双方 知道 的 (这 个 例子 中 是 Alice 和 Bob)。 因 此 如 果 Alice 需要 签署 另 一 
份 文档 ， 并 发 送 给 Ted， 那 她 就 需要 使 用 另外 的 密 钥 。 其 次 ， 我 们 将 看 到 ， 为 一 个 对 话 创 建 
密 钥 涉及 验证 ， 而 验证 要 使 用 数字 签名 。 因 此 ， 我 们 就 遇 到 一 个 错误 的 循环 。 再次，Bob 可 
以 使 用 他 和 Alice 间 的 密 钥 签署 一 个 文档 ， 把 它 发 送 给 Tde， 假 装 这 是 来 自 于 Alice 的 。 

.数字 签名 需要 公 铀 系统 。 签 署 者 用 私 钥 签署 ， 验 证 者 用 签署 者 的 公 钥 验证 。 

我 们 需要 区 分 数字 签名 中 的 私 钥 和 公 钥 以 及 在 为 了 机 密 性 的 密码 系统 中 的 公 铀 和 私 钥 。 
后 者 ， 接 收 者 的 公 钥 和 私 钥 被 用 在 处 理 过 程 中 ， 发 送 者 使 用 接收 者 的 公 钥 进行 加 密 ， 接 收 者 
使 用 他 自己 的 私 钥 进行 解密 。 在 数字 签名 中 ， 发 送 者 的 私 钥 和 公 钥 被 使 用 。 发 送 者 使 用 他 
(或 她 ) 的 私 钥 ， 而 接收 者 使 用 发 送 者 的 公 钼 。 

”密码 系统 使 用 接收 者 的 私 钥 和 公 钥 ; 数字 签名 使 用 发 送 者 的 私 钥 和 公 和 钥 。 

3. 签署 摘要 

当 处 理 较 长 消息 时 ， 非 对 称 密 钥 密码 系统 的 效率 低下 。 在 数字 签名 系统 中 ， 消 息 通常 较 
长 ， 但 我 们 不 得 不 使 用 非 对 称 密 钥 模式 。 解 决 方法 是 签署 消息 的 摘要 ， 该 摘要 比 消息 本 身 要 
短 得 多 。 一 个 仔细 选择 的 消息 摘要 与 消息 具有 一 对 一 的 关系 。 发 送 者 可 以 签署 消息 摘要 ， 接 
收 者 可 以 验证 消息 摘要 ， 两 者 的 效果 是 相同 的 。 图 16-14 显示 了 在 数字 签名 系统 中 的 摘要 的 
签署 。 





16-14 签署 摘要 
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摘要 从 Alice 端的 消息 中 制造 出 来 。 然 后 摘要 通过 了 使 用 Alice 私 钥 的 签署 过 程 ，Alice 
把 消息 和 签名 发 给 Bob。 

在 Bob 端 ， 使 用 相同 的 公开 的 散 列 函数 ， 一 个 摘要 就 从 接收 到 的 消息 中 制造 出 来 。 应 
用 验证 过 程 。 如 果 可 信 ， 消 息 被 接受 ， 否 则 ， 消 息 被 拒绝 。 

4. 服务 

我 们 在 本 章 的 开头 讨论 了 几 个 安全 服务 ， 包 括 消息 机 密 性 、 消 息 验 证 、 消 息 完整 性 和 不 
可 抵赖 性 。 

(1) 消息 验证 

一 个 安全 的 数字 签名 模式 就 像 一 个 安全 的 普通 签名 (也 就 是 说 一 个 人 不 容易 复制 ) 一 样 
能 提供 消息 验证 ， 也 称 为 数据 源 验 证 。Bob 能 验证 Alice 发 送 过 来 的 信息 是 因为 在 验证 过 程 
中 使 用 了 Alice 的 公 钥 。Alice 的 公 钥 不 能 验证 用 Eve 私 钥 签署 的 签名 。 

(2 ) 消息 完整 性 

如 果 我 们 签署 消息 或 消息 的 摘要 ， 消 息 的 完整 性 就 能 被 保护 ， 因 为 如 果 消 息 改 变 了 ,我 
们 就 不 能 得 到 相同 的 摘要 。 当 今 的 数字 签名 模式 在 签署 和 验证 算法 中 使 用 了 散 列 函数 ， 这 样 
更 好 地 保护 了 消息 的 完整 性 。 

(3 ) 不 可 抵赖 性 

如 果 Alice 签署 了 一 个 消息 ， 然 后 否认 它 ，Bob 能 和 否 证 明 Alice 实际 上 是 签署 了 它 呢 ? 
例如 ， 如 果 Alice 向 银行 (Bob) 发 送 消息 ， 要 求 从 她 的 账户 转 10 000 美元 到 Ted 的 账户 ， 
Alice 能 否 事后 否认 她 发 送 过 这 样 的 消息 ?使 用 我 们 目前 为 止 介绍 的 模式 ，Bob 可 能 会 有 一 
个 问题 。Bob 必须 先 保存 签名 ， 然 后 用 Alice 的 公 钥 去 建立 原始 消息 ， 去 证 明文 件 中 的 信息 
和 新 创建 的 消息 是 相同 的 。 但 这 样 并 不 可 行 ， 因 为 Alice 这 时 可 能 已 经 更 换 了 私 钥 或 公 钥 。 
她 也 可 以 声称 含有 签名 的 文件 是 不 可 信 的 。 

一 个 解决 方案 就 是 可 信 的 第 三 方 。 人 们 可 以 在 他 们 之 间 建 立 可 信 中 心 。 在 本 章 的 后 面 ， 
我 们 将 看 到 受到 信任 的 第 三 方 可 以 解决 有 关 安 全 服务 和 密 钥 交 换 的 很 多 问题 。 图 16-15 展示 
了 一 个 可 靠 的 第 三 方 如 何 防止 Alice 抵赖 她 发 过 的 消息 。 

Bob 
ee :全 


M: 消息 : 可 信 中 心 的 公 负 人 
S\: Alice 的 签名 ! 
Si: 可 信 中 心 的 签名 











验证 算法 





-=-----=-----=-4=---2 上 


可 信 中 心 





(M, SA) (M, Sn 


图 16-15 使 用 可 信 的 第 三 方 来 达到 不 可 抵赖 性 


在 这 种 模式 下 ，Alice 从 她 的 消息 创建 一 个 签名 ( SA)， 发 送 她 的 消息 、 她 的 标识 、Bob 
的 标识 和 签名 到 可 信 中 心 。 中 心 在 检查 Alice 的 公 钥 是 合法 的 之 后 ， 通 过 Alice 的 公 钥 验证 


294 儿 16 但 


消息 来 自 Alice。 然 后 可 信 中 心 把 带 有 发 送 者 标识 、 接 收 者 标识 和 时 间 戳 的 消息 的 副本 保存 
在 档案 中 。 中 心 使 用 它 的 私 钥 由 消息 创建 另 一 个 签名 ( Sr)， 然 后 中 心 把 消息 、 新 的 签名 、 
Alice 的 标识 和 Bob 的 标识 发 送 给 Bob。Bob 使 用 可 信 中 心 的 公 钥 验证 信息 。 

如 果 将 来 某 个 时 候 Alice 抵赖 她 发 送 的 消息 ， 中 心 就 可 以 显示 出 保存 消息 的 副本 。 因 为 
Bob 的 消息 是 保存 在 可 信 中 心 的 消息 的 一 个 副本 ， 所 以 ，Alice 将 会 在 争辩 中 输 掉 。 为 了 使 
得 任何 东西 变 得 机 密 ， 一 定 程度 的 加 密 和 解密 可 以 加 到 此 模式 中 ， 下 一 节 将 介绍 。 

(4 ) 机 密 性 

数字 签名 不 提供 机 密 通信 ， 如 果 机 密 性 是 需要 的 ,那么 消息 和 签名 就 要 使 用 对 称 密 钥 密 
码 或 非 对 称 密 钥 密码 进行 加 密 。 

签名 人 Alice 首先 通过 一 个 商定 的 散 列 函数 D=h(M) 从 消息 中 创建 一 个 摘要 ， 然 后 她 
通过 $=D? mod n 对 摘要 签名 。 这 个 信息 和 签名 都 发 送 给 Bob。Bob 收 到 消息 和 签名 后 首 
先 通过 Alice 的 公共 指数 D'=5S* mod 7 检索 摘要 ， 然 后 他 对 收 到 的 消息 应 用 散 列 算法 得 到 
D=h(M)。 现 在 Bob 对 比 两 个 摘要 D 和 D'， 如 果 它 们 相等 (在 模 数 代数 中 )， 他 接受 这 个 
消息 。 


16.3.4 ”实体 验证 


实体 验证 用 来 使 得 一 方 证 明 另 一 方 标识 的 一 种 技术 。 一 个 实体 可 以 是 一 个 人 、 一 个 过 
程 、 一 个 客户 端 或 一 个 服务 器 。 身 份 需要 证 明 的 实体 称 为 要 求 者 。 试 图 证 明 要 求 者 身份 的 一 
方 称 为 证 明 者 。 

1. 实体 验证 与 消息 验证 

在 消息 验证 (数据 源 验证 ) 和 实体 验证 间 有 两 点 区 别 : 

1 ) 消息 验证 (或 数据 源 验 证 ) 可 能 不 会 发 生 在 实时 系统 中 ， 而 实体 验证 是 会 的 。 在 前 
面 的 例子 中 ，Alice 发 送 一 条 消息 给 Bob。 在 Bob 验证 消息 的 时 候 ，Alice 可 能 在 或 可 能 不 
在 通信 的 过 程 中 。 在 另 一 方面 ， 当 Alice 要 求实 体验 证 时 ， 没 有 实际 消息 通信 被 涉及 ， 直 到 
Alice 的 身份 被 Bob 验证 。Alice 需要 在 线 参加 这 个 过 程 。 只 有 她 的 身份 被 验证 后 ， 消 息 才 
能 在 Alice 和 Bob 间 传 输 。 当 一 则 电子 邮件 从 Alice 到 Bob， 这 时 需要 的 是 数据 源 验证 ; 当 
Alice 从 自动 取款 机 上 取现 金 时 ， 这 时 需要 实体 验证 。 

2 ) 消息 验证 简单 地 验证 一 则 消息 ， 这 个 过 程 需 对 每 则 新 的 消息 重复 。 实 体验 证 可 在 整 
个 会 话 期 间 内 验证 要 求 者 。 

2. 验证 分 类 

在 实体 验证 中 ， 要 求 者 必须 向 证 明 者 标识 自己 。 这 可 以 使 用 下 面 三 种 证 据 中 的 一 种 : 所 
知道 的 、 所 拥有 的 或 所 固有 的 。 

e 所 知道 的 。 这 是 一 种 只 有 要 求 者 知道 的 秘密 ,证 明 者 可 以 通过 它 来 检查 要 求 者 。 这 

样 的 例子 有 : 密码 、PIN 码 、 密 钥 和 私 钥 。 

e 所 拥有 的 。 这 种 东西 能 证 明 要 求 者 的 身份 。 这 样 的 例子 有 : 护照 、 驾 驶 证 、 身 份 证 、 

信用 卡 和 智能 卡 。 

e 所 固有 的 。 这 是 要 求 者 内 在 固有 的 特性 。 这 样 的 例子 有 : 普通 签名 、 指 纹 、 声 音 、 

面部 特征 、 视 网 膜 模型 和 手迹 。 

在 这 部 分 我 们 只 讨论 第 一 种 验证 ， 所 知道 的 。 这 种 验证 通常 用 作 远 程 (在 线 ) 实体 验证 。 
另外 两 个 分 类 则 通常 在 要 求 者 个 人 出 现时 使 用 。 


由 
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3. 密码 

最 简单 且 最 古老 的 实体 身份 验证 的 方法 是 基于 密码 的 身份 验证 ， 密 码 是 要 求 者 知道 的 一 
些 东西 。 当 用 户 需 要 访问 系统 资源 时 (登录)， 他 就 需要 一 个 密码 。 每 个 用 户 都 有 一 个 用 户 
标识 ， 这 是 公开 的 ; 还 有 一 个 密码 ， 这 是 私有 的 。 然 而 ， 密 码 在 攻击 面前 很 脆弱 。 密 码 可 能 
被 窃取 、 截 获 或 猜 出 等 。 

4. 挑战 - 回应 

在 密码 验证 中 ， 要 求 者 通过 展示 他 们 知道 秘密 (密码 ) 来 证 明 他 们 的 身份 。 但 是 要 求 者 
暴露 了 这 个 秘密 ， 就 容易 受到 敌手 的 截获 。 在 挑战 - 回应 身份 验证 中 ， 要 求 者 能 证 明 他 知道 
秘密 而 不 需要 暴露 它 。 换 言 之 ， 要求 者 没有 把 秘密 发 送 给 证 明 者 ,但 证 明 者 或 者 有 它 ， 或 者 
能 找到 它 








验证， 要 者 证 他 们 知 半 密 ， 而 不 需要 把 和 祝 





挑战 是 一 个 随时 间 变 化 的 值 ， 如 随机 数 或 一 个 时 间 戳 ， 它 由 证 明 者 发 送 给 要 求 者 。 要 求 
者 对 挑战 运用 一 个 函数 ， 把 结果 〈 称 为 响应 ) 发 送 给 证 明 者 。 响 应 表明 要 求 者 知道 秘密 。 

(1 ) 使 用 对 称 密 钥 密码 

有 几 种 方法 可 以 利用 对 称 密 钥 加 密 来 挑战 - 回应 。 这 里 共享 的 秘密 是 要 求 者 和 证 明 者 都 
知道 的 共享 密 钥 。 使 用 对 称 密 钥 密码 的 作用 是 对 挑战 应 用 加 密 算 法 。 虽 然 达 到 这 个 手段 有 几 
种 方法 ， 我 们 只 给 出 最 简单 的 一 种 来 给 出 思想 。 图 16-16 展示 了 第 一 种 方法 。 


Alice ,Bob 
(要 求 者 ) 命 使 用 Alice-Bob 密 钥 加 窗 《证 明 者 ) 


Ra: Bob 发 送 的 随机 数 





图 16-16 单 向 对 称 密 钥 验证 


第 一 个 消息 不 是 挑战 - 回应 的 一 部 分 ， 他 只 告知 证 明 者 要 求 者 想 要 进行 挑战 。 第 二 
消息 是 挑战 。Rs 是 证 明 者 ( Bob) 为 了 挑战 要 求 者 随便 挑选 的 随机 数 (一 定数 量 的 缩写 )。 
要 求 者 将 随机 数 通 过 只 有 要 求 者 和 证 明 者 知道 的 秘密 共享 密 钥 进行 加 密 并 将 结果 发 送 给 证 
明 者 。 证 明 者 对 消息 进行 解密 ， 如 果 得 到 的 随机 数 和 证 明 者 发 送 的 相同 ，Alice 就 得 到 许可 
进入 。 

注意 在 这 个 过 程 中 ， 要 求 者 和 证 明 者 需要 在 过 程 中 对 他 们 使 用 的 对 称 密 钥 保 密 。 证 明 者 
也 必须 保存 给 要 求 者 进行 鉴别 的 随机 数值 直到 返回 回应 。 

(2 ) 使 用 非 对 称 密 钥 密码 

图 16-17 展示 了 这 个 方法 。 我 们 可 以 使 用 非 对 称 密 钥 密 码 代 替 对 称 密 钥 密 码 进行 实体 验 
证 。 在 这 里 秘密 必须 是 要 求 者 的 密 钥 。 要 求 者 必须 显示 她 拥有 的 私 钥 和 所 有 人 都 有 的 公 钥 相 
关 。 也 就 是 说 ， 证 明 者 必须 使 用 要 求 者 的 公 钥 对 挑战 进行 加 密 ; 然后 要 求 者 使 用 她 的 私 钥 对 
消息 解密 ， 对 该 挑战 的 回应 就 是 解密 后 的 消息 。 
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例 使 用 Alice 的 公 钥 加 密 


Bob 
(要 求 者 ) (证 明 者 ) 
a R,: Bob 发 送 的 随机 数 









图 16-17 单 向 非 对 称 密 钥 验 证 


(3 ) 使 用 数字 签名 
实体 验证 也 可 以 通过 使 用 数字 签名 来 达到 。 当 数字 签名 用 在 实体 验证 时 ， 要 求 者 使 用 她 的 
私 钥 进 行 签名 。 在 第 一 种 方法 中 ， 如 图 16-18 所 示 ，Bob 使 用 明文 挑战 ， 然 后 Alice 签署 回应 。 
Alice Bob 


(要 求 者 ) (证 明 者 》 
f R。: Bob 发 送 的 随机 数 








1 


| Rs 2 
Bob, 


用 Alice 的 私 钥 签 署 


图 16-18 单 向 数字 签名 验证 


16.3.5” 密 钥 管 理 


我 们 在 前 几 节 讨论 了 对 称 密 钥 和 非 对称 密 钥 密 码 术 。 然 而 我 们 还 没有 讨论 对 称 密 钥 密码 
术 中 的 密 钥 和 非 对 称 密 钥 密码 术 中 公 钥 是 如 何 分 配 和 维持 的 。 这 节 将 接触 这 两 个 问题 。 

1. 对 称 密 钥 分 发 

在 对 大 量 消 息 进 行 加 密 时 ， 对 称 密 钥 密 码 术 的 效率 比 非 对 称 密 钥 密码 术 要 高 ， 但 是 ， 对 
称 密 钥 密 码 术 需 要 在 双方 间 共 享 密 钥 。 

如 果 Alice 需要 和 个 人 交换 机 密 性 消息 ， 她 需要 N 个 不 同 的 密 钥 。 如 果 X 个 人 需要 互 
相交 流 呢 ? 如 果 我 们 要 求 每 两 个 人 都 使 用 两 个 密 钥 进行 双向 通信 ， 总 共 需 要 N(N-1) 个 密 钥 。 
如 果 我 们 允许 利用 同一 个 密 钥 进行 双向 通信 ， 只 需要 有 N(N-1)/2 个 密 钥 来 进行 对 称 密 钥 通信 。 
也 就 是 说 ， 如 果 100 万 人 需要 互相 通信 ， 每 个 人 几乎 要 有 100 万 个 不 同 的 密 钥 ; 总 共和 需要 5 
亿 个 密 钥 。 这 个 通常 称 为 N? 问题 ， 因 为 N 个 实体 需要 的 密 钥 总 数 接近 于 N?。 

密 钥 的 数目 不 是 唯一 问题 ， 密 钥 的 分 发 是 另 一 个 问题 。 如 果 Alice 和 Bob 要 进行 通信 ， 
他 们 就 需要 一 种 方法 来 交换 密 钥 。 如 果 Alice 要 与 100 万 人 进行 通信 ， 她 如 何 能 与 100 万 人 
交换 密 钥 ? 使 用 因特网 肯定 不 是 一 个 安全 的 方法 。 很 显然 我 们 需要 一 种 有 效 的 方法 来 维护 和 
分 发 密 钥 。 

(1 ) 密 钥 分 发 中 心 : KDC 

一 个 实用 的 解决 方案 是 使 用 可 信 第 三 方 ， 称 为 密 钥 分 发 中 心 (KDC)。 为 了 减少 密 钥 的 
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数量 ， 每 个 人 与 KDC 建立 一 个 共享 的 密 钥 。 一 个 密 钥 建 立 在 KDC 和 每 个 成 员 间 。 现 在 的 
问题 是 Alice 如 何 向 Bob 发 送 机 密 消 息 。 过 程 如 下 : 

1 ) Alice 向 KDC 发 送 一 个 请 求 ， 说 明 她 需要 一 个 和 Bob 之 间 的 会 话 ( 临 时 的 ) 密 钥 。 

2 ) KDC 告诉 Bob 关于 Alice 的 请 求 。 

3 ) 如 果 Bob 同意 ， 一 个 会 话 密 钥 就 在 二 者 之 间 建 立 了 。 

密 钥 的 作用 是 为 了 使 Alice 和 Bob 在 KDC 得 到 验证 通过 ， 并 且 防 止 Eve 冒充 他 们 中 的 
任何 一 个 ， 这 里 的 密 钥 是 通过 KDC 建立 的 。 

(2 ) 多 个 密 钥 分 发 中 心 

当 使 用 同一 个 密 钥 分 发 中 心 的 人 数 增 多 时 ， 系 统 会 变 得 难以 管理 并 导致 瓶颈 。 为 了 解 
决 这 个 问题 ， 我 们 可 以 拥有 多 个 密 钥 分 发 中 心 。 我 们 将 世界 划分 成 区 域 。 每 个 区 域 有 一 个 或 
多 个 KDC (备用 防止 KDC 故障 )。 现 在 如 果 Alice 想 发 机 密 消 息 给 在 另外 一 个 区 域 的 Bob， 
Alice 和 该 区 的 KDC 联系 ， 随 后 和 Bob 所 在 区 域 的 KDC 联系 。 两 个 KDC 创造 在 Alice 和 
Bob 之 间 使 用 的 密 钥 。 这 些 可 能 是 本 地 KDC、 本 国 的 KDC 或 者 是 国际 KDC。 当 Alice 想 和 
居住 在 另 一 个 国家 的 Bob 联系 时 ， 她 将 她 的 请 求 发 给 本 地 KDC， 本 地 KDC 将 请 求 接替 至 
本 国 KDC， 本 国 的 KDC 将 请 求 接替 至 国际 KDC。 这 个 请 求 就 这 样 接替 发 送 至 Bob 住地 的 
本 地 KDC。 图 16-19 展示 了 一 个 分 级 多 个 KDC 的 布局 。 


国家 KDC oo 国家 KDC 


本 地 KDC 





本 地 KDC 


< 全 Bob 


图 16-19 多 个 KDC 


(3 ) 会 话 密 钥 

KDC 为 每 个 成 员 建 立 一 个 密 铜 ， 这 个 密 钥 只 可 以 在 成 员 和 KDC 之 间 使 用 ， 而 不 是 两 
个 成 员 之 间 。 如 果 Alice 需要 和 Bob 秘密 通信 ， 她 需要 一 个 在 她 和 Bob 之 间 的 秘密 密 钥 。 
KDC 可 以 建立 Alice 和 Bob 之 间 的 会 话 密 钥 ， 通 过 密 钥 和 中 心 会 话 。Alice 和 Bob 的 密 钥 是 
在 会 话 密 钥 建立 前 用 来 授权 Alice 和 Bob 与 中 心 通信 和 互相 通信 的 。 当 通信 终止 后 ， 会 话 密 





-个 双方 间 的 会 话 对 称 密 钥 只 被 使 用 一 次 。 NR Ss 

几 种 使 用 前 几 节 谈 到 的 思想 来 创建 会 话 密 角 的 方法 已 经 提出 。 我 们 在 图 1 16- 20 0 中 展示 了 
最 简单 的 方法 。 虽 然 这 个 方法 很 基础 ， 但 它 有 助 于 理解 文献 中 的 那些 更 复杂 的 方法 。 

1 ) Alice 发 送 明文 消息 到 KDC 来 得 到 她 和 Bob 之 间 的 对 称 会 话 密 钥 。 这 个 消息 包含 她 
的 注册 信息 (图 中 的 文字 Alice) 和 Bob 的 身份 (图 中 的 文字 Bob)。KDC 不 在 乎 这 个 消息 是 
不 加 密 公开 的 。 

2 ) KDC 检索 接收 到 的 消息 创建 存根 ， 这 个 存根 使 用 Bob 的 密 钥 ( Ks) 进行 加 密 ， 里 
面包 含 Alice 和 Bob 的 身份 和 会 话 密 钥 。 存 根 和 会 话 密 钥 的 副本 发 送 给 了 Alice。Alice 收 到 
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消息 ， 解 密 并 提取 出 会 话 密 钥 。 她 无 法 解密 Bob 的 存根 ， 因 为 存根 是 给 Bob 的 而 不 是 她 的 。 
注意 ， 这 条 消息 使 用 了 双重 加 密 一 一 存根 是 加 密 的 ， 同 时 整 条 消息 也 是 加 密 的 。 在 第 二 条 信 
息 中 ，Alice 其 实 是 经 过 KDC 鉴别 的 ， 因 为 只 有 她 可 以 利用 她 和 KDC 之 间 的 密 钥 打开 整个 
消息 。 


K, 约 用 Alice-KDC 密 钥 加 密 Alice 和 Bob 间 的 会 话 密 铀 
K, 组 用 Bob-KDC 密 钥 加 密 





图 16-20 用 KDC 创建 会 话 密 钥 


3 ) Alice 将 存根 发 给 Bob，Bob 打开 存根 然后 得 知 Alice 需要 用 会 话 密 钥 给 他 发 送 消息 。 
注意 在 这 个 消息 中 ，Bob 通过 了 KDC 鉴别 ， 因 为 只 有 他 可 以 打开 存根 。 因 为 Bob 通过 了 
KDC 的 鉴别 ， 所 以 Alice 信任 KDC 并 且 通 过 了 他 的 鉴别 。 同 样 的 道理 ，Alice 也 通过 了 Bob 
的 鉴别 ， 因 为 Bob 信任 KDC 而 且 KDC 将 含有 Alice 身份 的 存根 发 给 了 Bob。 

2. 公 铀 分 发 

在 非 对 称 密 钥 密码 术 中 ， 人 们 不 需要 一 个 对 称 的 共享 密 钥 。 如 果 Alice 想 要 给 Bob 发 
送 消息 ， 她 只 要 知道 Bob 的 公 钥 ， 这 个 公 钥 是 对 公众 公开 的 ， 任 何人 都 可 以 使 用 的 。 如 果 
Bob 需要 向 Alice 发 送 一 消息 ， 他 也 只 需要 知道 Alice 的 公 钥 ， 这 个 公 钥 也 是 任何 人 都 知道 
的 。 在 公 钥 密 码 术 中 ， 起 公开 公司。 





公 钥 像 密 角 ， 也 需要 人 发 这 样 才 有 用 5 让 我 们 简单 地 讨论 一 下 公 \ 钥 被 分 的 方法 。 

(1 ) 公开 声明 

天 真 的 方法 是 公开 地 声明 公 钥 。Bob 可 以 把 他 的 公 钥 放 在 网 站 上 ， 或 在 地 方 或 国家 的 报 
纸 上 发 表 声 明 。 当 Alice 需要 给 Bob 发 送 一 条 机 密 消息 时 ， 她 可 以 从 Bob 的 网 站 上 或 报纸 上 
得 到 Bob 的 公 钥 ， 或 者 甚至 她 可 以 发 送 一 条 消息 请 求 该 公 钥 。 但 是 ， 这 种 方法 不 安全 ， 它 
可 能 被 伪造 。 例 如 , Eve 可 能 作 了 这 个 的 公开 声明 ， 在 Bob 有 行动 之 前 ， 损 坏 可 能 已 经 造成 。 
Eve 可 以 愚弄 Alice， 让 Alice 发 给 她 一 条 本 来 要 发 送 给 Bob 的 消息 。Eve 也 可 以 用 相应 的 伪 
造 的 私 钥 签署 一 个 文档 ， 使 所 有 人 相信 这 是 Bob 签署 的 。 如 果 Alice 直接 向 Bob 请 求 公 钥 ， 
这 种 方法 也 是 脆弱 的 。Eve 可 以 截获 Bob 的 回应 ， 用 她 自己 伪造 的 公 钥 来 替换 Bob 的 公 钥 。 

(2 ) 认证 机 构 

最 常用 的 分 发 公 钥 的 方法 是 建立 公 钥 认证 。Bob 想 要 两 件 事情 : 他 想 要 人 们 知道 他 的 公 
钥 ， 他 想 要 没有 人 接受 假冒 他 的 公 钥 。Bob 可 以 去 认证 机 构 (CA)， 它 是 一 个 把 公 钥 和 实体 
捆绑 在 一 起 并 处 理 认 证 的 政府 机 构 。 图 16-21 展示 了 这 个 概念 。 
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@" CA 
' Bob 的 公 负 目录 
了 


分 发 给 公众 





发 布 


、 


图 16-21 认证 机 构 


CA 本 身 有 一 把 众所周知 的 公 钥 ， 这 把 公 钥 不 能 伪造 。CA 先 检 查 Bob 的 身份 ， 比 如 通 
过 一 张 带 照 片 的 身份 证 和 其 他 一 些 证 据 。 然 后 ，CA 向 Bob 要 公 钥 ， 并 把 它 写 在 证 书 上 。 为 
了 防止 证 书本 身 被 伪造 ，CA 用 它 的 私 钥 签署 证 书 。 现 在 Bob 可 以 上 载 签署 的 证 书 。 任 何 需 
要 Bob 公 钥 的 人 就 可 以 下 载 签署 的 证 书 ， 并 使 用 中 心 的 公 钥 来 抽取 出 Bob 的 公 钥 。 

(3 ) X.509 

虽然 CA 的 使 用 可 以 解决 公 钥 骗局 的 问题 ， 它 也 产生 了 副作用 。 每 个 证 书 的 格式 可 能 都 
不 一 样 ， 如 果 Alice 想 利用 程序 来 自动 下 载 不 同 的 证 书 和 不 同人 的 消息 摘要 ， 这 个 程序 不 一 
定 能 做 到 。 一 个 证 书 的 公 钥 可 能 是 这 个 格式 的 而 另 一 个 证 书 的 公 钥 格式 可 能 又 不 一 样 ， 存 放 
公 钥 的 位 置 可 能 在 这 个 证 书 里 是 第 一 行 ， 而 在 另外 一 个 证 书 里 却 是 第 三 行 。 普 遍 的 使 用 必须 
依赖 通用 的 格式 ， 为 了 消除 这 个 副作用 ，ITU 设计 了 X.509， 一 个 在 经 历 部 分 修改 后 被 因 特 
网 广泛 接受 的 建议 。X.509 是 一 个 结构 化 描述 证 书 的 方式 。 它 使 用 叫做 ASN.1 (在 第 9 章 中 
提 过 ) 的 一 个 众所周知 的 协议 ， 这 个 协议 定义 了 计算 机 编程 者 很 熟悉 的 一 些 领域 。 


16.4 ”防火 墙 


前 面 这 些 安全 测试 都 无 法 防止 Eve 向 一 个 系统 发 送 有 害 信 息 。 我 们 需要 防火 墙 来 控制 对 
系统 的 访问 。 防 火 墙 是 一 个 安装 在 一 个 组 织 的 内 部 网 络 和 因特网 其 他 部 分 之 间 的 设备 (通常 是 
一 个 路 由 器 或 计算 机 )。 防 火 墙 是 为 了 推进 一 些 数据 包 而 过 滤 其 他 数据 包 而 设计 的 。 图 16-22 
展示 了 一 个 防火 墙 。 

例如 ， 防 火 墙 可 能 会 过 滤 所 有 到 来 的 
目标 为 特定 主机 或 服务 器 〈 例 如 HTTP) 的 
数据 包 。 防 火 墙 也 可 以 用 来 阻拦 对 组 织 内 
特定 主机 或 服务 的 访问 。 防 火 墙 通常 分 为 
包 过 滤 防 火 墙 和 代理 防火 墙 。 


16.4.1 包 过 滤 防 火 墙 


防火 墙 可 以 用 做 数据 包 过 滤器 。 它 可 
以 基于 网 络 层 的 信息 和 传输 层 的 头 部 : 源 
和 目标 IP 地 址 ， 源 和 目标 端口 地 址 以 及 协 图 16-22 防火 墙 
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议 的 种 类 (TCP 或 UDP) 来 推进 或 阻拦 数据 包 。 包 过 滤 防 火 墙 是 一 个 使 用 过 滤 表 单 决定 哪些 
数据 包 应 该 丢弃 (不 推进 ) 的 路 由 器 。 图 16-23 展示 了 这 类 防火 墙 的 过 滤 表 格 示例 。 


包 过 滤 防 火 墙 








图 16-23 包 过 滤 防 火 墙 


根据 图 ， 以 下 数据 包 被 过 滤 : 

1 ) 来 自 网 络 131.34.0.0 的 数据 包 被 阻拦 了 (安全 预防 措施 )。 注 意 * 号 代表 “任何 ”。 

2 ) 终点 为 任何 国际 TELNET 服务 器 (端口 23 ) 的 外 发 数据 包 被 阻拦 了 。 

3 ) 到 来 的 目标 为 内 部 主机 194.78.20.8 的 数据 包 被 阻拦 了 ， 该 组 织 希望 这 个 主机 只 用 于 
内 部 使 用 。 

4 ) 终点 为 HTTP 服务 器 (端口 80 ) 的 外 发 数据 包 被 阻拦 了 ， 该 组 织 不 希望 雇员 浏览 因特网 。 


16.4.2 ”代理 防火 墙 


“ 包 过 滤 防 火 墙 是 基于 网 络 层 的 有 效 信息 和 传输 层 头 部 (IP 和 TCP/UDP) 建立 的 。 然 而 ， 
有 时 我 们 也 需要 基于 消息 自身 携带 的 信息 (应 用 层 上 ) 进行 过 滤 。 比 如 ， 假 设 一 个 组 织 想 对 
其 网 页 试 试 以 下 几 条 政策 : 只 有 那些 之 前 与 本 公司 建立 商业 联系 的 因特网 用 户 可 以 访问 ; 其 
他 用 户 必须 阻拦 。 这 个 情况 下 ， 数 据 包 过 滤 防 火 墙 就 不 可 行 ， 因 为 它 无 法 区 分 到 达 TCP 端 
口 80 (HTTP) 的 不 同 数据 包 ， 必 须 在 应 用 层 (通过 URL) 进行 测试 。 

一 个 解决 措施 是 安装 代理 计算 机 (有 时 也 称 为 应 用 网 关 )， 代 理 计算 机 位 于 客户 计算 机 
和 公司 计算 机 之 间 。 当 用 户 客 户 进 程 发 送 消 息 时 ， 应 用 网 关 运 行 服务 器 进程 来 接收 请 求 。 服 
务 器 在 应 用 层 打 开 数 据 包 并 且 查 找 这 个 请 求 是 否 合 法 。 如 果 是 ， 那 么 服务 器 运行 客户 端 进程 
并 将 消息 发 给 公司 中 真正 的 服务 器 ， 否 则 这 个 消息 会 被 丢弃 并 且 错 误 消息 会 发 给 外 部 用 户 。 
通过 这 个 方法 ， 外 部 用 户 的 请 求 基于 内 容 在 应 用 层 进 行 筛选 。 图 16-24 展示 了 HTTP 的 一 个 
应 用 网 关 的 实现 。 


错误 





图 16-24 ”代理 防火 墙 
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16.5 ” 章 末 材料 
推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 


小 结 


Bishop, M. Computer Security, Reading, MA: Addison Wesley, 2002 

Forouzan, B. Cryptography and Network Security, New York:McGraw-Hill, 20007 
Kaufman, C., Perlman, R. and Speciner, M. Network Security, Upper Saddle River, NJ: 
Prentice Hall, 2002 

Stallings, W. Cryptography and Network Security, Upper Saddle River, NJ: Prentice 
Hall, 2006 


我 们 提 到 三 个 安全 目标 : 机 密 性 、 完 整 性 和 可 用 性 。 我 们 把 对 安全 的 攻击 分 成 三 大 
类 : 威胁 机 密 性 的 攻击 、 威 胁 完整 性 的 攻击 和 威胁 可 用 性 的 攻击 。 为 了 取得 安全 目 
标 和 防止 相应 的 攻击 ，ITU-U (international telecommunication union) 定义 了 下 列 的 
服务 : 数据 机 密 性 、 数 据 完 整 性 、 身 份 验 证 、 不 可 抵赖 和 访问 控制 。 两 种 技术 被 用 
来 提供 这 些 服 务 : 密码 术 和 隐 写 术 。 

对 称 密 钥 密 码 术 使 用 一 个 密码 进行 加 密 和 解密 。Alice 和 Bob 首先 要 认可 一 个 共享 的 
秘密 ， 这 个 秘密 构成 了 他 们 的 密 钥 。 为 了 发 信息 给 Bob ，Alice 使 用 密 钥 加 密 信息 ; 
为 了 发 信息 给 Alice，Bob 使 用 相同 的 密 钥 加 密 信息 。 传 统 对 称 密 钥 密码 是 面向 字符 
的 ， 使 用 两 种 技术 向 人 侵 者 隐藏 信息 : 替换 和 置换 。 

现代 对 称 密 钥 密码 面向 二 进 制 位 ， 使 用 非常 复杂 的 算法 来 加 密 和 解密 二 进 制 位 块 。 
非 对 称 密 钥 密码 术 使 用 两 个 不 同 的 密 钥 : 私 钥 和 公 钥 。Bob 首先 创建 一 对 密 钥 ， 然 
后 保存 私 钥 ， 声 明 公 钥 。 如 果 有 人 需要 给 Bob 发 送信 息 ， 那 他 就 可 以 使 用 Bob 的 公 
钥 进 行 加 密 ， 为 了 阅读 信息 ，Bob 使 用 他 的 私 钥 解密 信息 。 

完整 性 就 是 保护 信息 ， 免 受 算 改 。 为 了 保存 信息 的 完整 性 ， 信 息 要 经 过 一 个 称 为 密 
码 散 列 函 数 的 算法 。 这 个 函数 创建 了 信息 的 压缩 影像 ， 称 为 信息 摘要 。 信 息 验证 代 
码 (MAC) 用 来 提供 信息 验证 。MAC 包含 发 送 者 和 接收 者 共享 的 秘密 。 数 字 签名 是 
电子 地 签署 文档 的 过 程 。 它 提供 信息 完整 性 、 信 息 验 证 和 不 可 抵赖 。 实 体验 证 是 一 
种 用 来 让 一 方 证 明 另 一 方 身份 的 技术 。 实 体 身份 验证 使 用 三 类 验证 : 所 知道 的 、 所 
拥有 的 和 所 固有 的 。 我 们 提 到 了 4 种 验证 技术 : 基于 密码 的 、 挑 战 一 回应 、 零 知识 
和 生物 测定 法 。 

对 于 对 称 密 钥 或 非 对 称 密 钥 密码 术 ， 双 方 都 需要 交换 密 钥 。 密 钥 管 理 方法 允许 我 们 
去 交换 密 钥 ， 而 不 需要 面对面 地 密 钥 交换 。 在 对 称 密 钥 密码 术 中 ， 实 用 的 解决 方案 
是 使 用 密 钥 分 发 中 心 (KDC)。 在 非 对 称 密 钥 密码 术 中 ， 实 用 的 解决 方案 是 使 用 由 认 
证 机 构 (CA) 认证 的 证 书 。 


16.6 练习 


小 测验 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建 议 学 生 在 继续 本 章 习 题 前 首先 
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完成 相关 测验 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 以 下 哪 种 攻击 对 机 密 性 有 威胁 ? 
a. 嗅 控 b. 伪装 c. 抵赖 

2. 以 下 哪 种 攻击 对 完整 性 有 威胁 ? 
a. 算 改 b. 重复 c. 拒绝 服务 

3. 以 下 哪 种 攻击 对 可 用 性 有 威胁 ? 
a. 抵赖 b. 拒绝 服务 c. 自 改 

4. 以 下 哪个 词汇 意思 是 “秘密 书写 "， 哪 个 是 “掩饰 书写 ”? 
a. 密码 术 b. 隐 写 术 

5. 当 密 封 的 信件 从 Alice 发 给 Bob 时 ， 这 是 一 个 使 用 密码 术 或 隐 写 术 来 保障 机 密 性 的 例子 吗 ? 

6. 从 Alice 发 给 Bob 的 信件 使 用 只 有 这 两 人 理解 的 语言 写成 ， 这 是 一 个 使 用 密码 术 或 隐 写 术 的 例 
子 吗 ? 

7.Alice 找到 一 个 秘密 写 给 Bob 的 方法 。 每 次 她 都 用 一 个 新 的 文本 ， 比 如 报纸 上 的 一 篇 文章 ， 但 会 在 单 
词 之 间 插入 1 或 2 个 空格 ， 单 空格 表示 二 进 制 0， 双 空格 表示 二 进 制 1。Bob 抽取 这 些 二 进 制 数码 ， 
并 用 ASCII 码 译 解 。 这 是 一 个 使 用 密码 术 或 隐 写 术 的 例子 吗 ? 请 说 明 。 

8. Alice 和 Bob 互相 交换 机 密 信息 。 他 们 共享 一 个 非常 大 的 数字 作为 双向 的 加 密 和 解密 密 钥 。 这 是 一 
个 使 用 对 称 密 钥 或 非 对 称 密 钥 密码 术 的 例子 吗 ? 请 说 明 。 

9. Alice 加 密 信 息 发 送 给 Bob 以 及 解密 收 到 Bob 的 信息 都 使 用 了 同样 的 密 钥 。 这 是 一 个 使 用 对 称 密 钥 
或 非 对 称 密 钥 密码 术 的 例子 吗 ? 请 说 明 。 

10. 区 分 替换 密码 和 置换 密码 。 

11. 在 密码 中 ， 所 有 明文 中 的 A 变化 成 密 文 中 的 D 并 且 所 有 明文 中 的 DD 变化 成 密 文 中 的 H。 这 是 一 个 

单字 母 或 多 字母 的 替换 密码 吗 ? 请 说 明 。 
12. 单字 母 或 多 字母 密码 ， 哪 个 更 容易 破解 ? 
13. 假设 Alice 和 Bob 使 用 模 26 的 加 法 密码 算法 。 入 侵 者 Eve 要 通过 尝试 所 有 可 能 的 密 钥 来 破解 ( 蛮 
力 攻 击 )， 她 要 平均 尝试 多 少 个 密 钥 ? 
14. 假设 我 们 有 一 个 1000 字符 的 纯 文本 。 按 照 下 列 密码 ， 各 需要 多 少 密 钥 来 加 密 或 解密 这 些 信息 ? 


a. 加 法 密码 b. 单字 母 密码 c. 自动 密 钥 密 码 
15. 根据 流 和 密码 块 的 定义 ， 找 出 下 列 密码 哪个 是 流 密 码 ? 
a. 加 法 密码 b. 单字 母 密码 c. 自动 密 钥 密码 


16. 如 果 一 次 一 密 乱 码 (如 图 16-7 所 示 ) 是 最 简单 和 最 安全 的 密码 ， 为 什么 不 一 直 使 用 ? 

17. 为 什么 你 认为 非 对 称 密 钥 密 码 术 只 用 于 少量 信息 ? 

18. 在 一 个 非 对 称 密 钥 密码 中 ， 哪 个 密 钥 用 于 加 密 ， 哪 个 密 钥 用 于 解密 ? 
a. 公 和 钥 b. 私 钥 

19. 在 RSA 密码 中 ， 为 什么 Bob 不 能 选择 1 作为 公 钥 e? 

20. 如 图 16-12 所 示 ， 加 入 散 列 函数 中 的 密 钥 (MAC) 扮演 了 什么 角色 ? 请 说 明 。 

21. 区 别 信 息 验 证 和 实体 验证 。 

22. Alice 为 她 发 送 给 Bob 的 信息 签名 以 证 明 她 是 该 信息 的 发 送 者 。Alice 需要 使 用 以 下 哪个 密 钥 ? 
a. Alice 的 公 钥 b. Alice 的 私 钥 

23. Alice 需要 给 50 人 的 组 群发 信息 。 如 果 Alice 需要 使 用 信息 验证 ， A 
a. MAC b. 数字 签名 

24. 数字 签名 不 支持 以 下 哪 种 服务 ? 
a. 信息 验证 b. 机 密 性 c. 不 可 抵赖 性 
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.定义 以 下 案例 的 攻击 种 类 : 
a. 一 个 学 生 破 墙 而 人 ， 进 入 教授 办 公 室 ， 获 得 下 次 考试 的 副本 。 
b. 一 个 学 生 用 $10 支票 购买 一 本 旧书 ， 后 来 发 现 该 支票 结算 了 $100 现金 。 
c. 一 个 学 生 用 伪造 的 电子 邮件 回复 地 址 每 天 给 学 校 发 送 数 百 份 邮件 。 

. 使 用 密 钥 为 10 的 加 法 密码 加 密 明 文 “book”， 然 后 解密 消息 ， 得 到 原始 明文 。 

.使 用 密 钥 为 20 的 加 法 密码 加 密 明 文 “this is an exercise”， 忽 略 单词 间 的 空格 。 然 后 解密 消息 ， 得 到 
原始 明文 。 

. Atbash 是 在 圣经 撰写 者 中 流行 的 密码 。 在 Atbash 中 ，A 密 写 为 Z，B 密 写 为 Y， 以 此 类 推 。 同 样 ， 
Z 密 写 为 A, Y 密 写 为 B， 以 此 类 推 。 假 设 字母 表 一 分 为 二 ， 前 半 字 母 表 中 的 字母 密 写 为 后 半 字 母 
表 的 字母 ， 反 之 亦 同 。 找 出 加 密 类 型 和 密 钥 。 使 用 Atbash 加 密 法 加 密 明 文 “an exercise”。 

5. 替换 密码 不 必 是 字符 到 字符 的 转换 。 在 棋盘 密码 中 ， 明 文中 的 每 个 字母 密 写 为 2 个 整数 。 密 钥 是 一 

个 5X5 字符 矩阵。 明文 是 矩阵 中 的 字符 ， 密 文 是 行列 对 应 的 2 个 整数 (在 1 一 5S 之 间 )。 使 用 棋盘 

加 密 法 的 以 下 密 钥 加 密 明 文 “An exercise”。 
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6. Alice 在 她 的 计算 机 上 只 用 加 法 加 密 向 她 的 朋友 发 送 消 息 。 她 认为 如 果 她 把 消息 加 密 2 次 就 更 安全 ， 
每 次 使 用 一 个 不 同 的 密 钥 。 她 对 吗 ? 给 出 你 的 解答 。 

7. 有 一 种 攻击 称 为 密 文 攻击 ， 人 和 人 侵 者 可 以 使 用 类 似 加 法 加 密 的 简单 加 密 法 。 在 这 种 类 型 的 攻击 中 ， 人 
侵 者 破解 加 密 ， 试 图 找到 密 钥 ， 最 终 获得 明文 。 用 于 攻击 密 文 的 方法 之 一 是 变 力 方法 ， 人 侵 者 尝试 
多 种 密 钥 不 断 破解 消息 ， 直 到 消息 有 意义 为 止 。 假 设 入 侵 者 有 密 文 “UVACLYZLJBYL”， 他 使 用 从 
1 开始 的 密 钥 尝试 破解 ， 直 到 出 现 有 意义 的 文字 。 

8. 在 移 位 加 密 中 ， 加 密 和 人 解密 密 钥 通常 出 现在 二 维 表格 (数组 ) 中 ， 加 密 算法 由 一 段 软件 (程序 ) 
实现 。 

a. 显示 图 16-5 中 加 密 密 钥 的 数组 。 提 示 : 每 个 元 素 的 值 可 以 表示 为 输入 列 数字 ， 索 引 可 表示 为 输出 
列 数字 。 
b. 显示 图 16-5 中 解密 密 钥 的 数组 。 
c. 解释 ， 给 出 加 密 密 钥 ， 我 们 如 何 能 找到 解密 密 钥 。 
9. 假设 Bob 使 用 RSA 密码 系统 ,选择 PP=11,， 4qg=13，d=7， 下列 哪个 是 公 钥 e 的 值 ? 
a.1l b.103 c.19 

10. 在 RSA 密码 系统 中 ,给 出 p= 107, g = 113，e = 13，d = 3653， 使 用 00-26 编码 表 ( 00 是 字母 A， 
26 是 空格 符 ) 加 密 消 息 “THIS IS TOUGH”。 解 密 密 文 ， 获 得 原始 消息 。 

11. 解释 为 什么 公私 钥 不 能 用 于 创建 MAC。 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概 念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建 议 学 生 通过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨论 材料 的 理解 。 
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在 第 1 ~ 16 章 中 ,我 们 把 计算 机 看 成 是 一 台 问 题 求 解 机 器 。 在 这 一 章 中 ， 我们 回答 一 
些 诸如 此 类 的 问题 : 哪些 问题 可 以 通过 计算 机 解决 ? 语言 之 间 是 否 存 在 优 劣 ? 运行 一 个 程序 
前 ， 是 否 可 以 确定 该 程序 将 要 停止 (终止 ) 还 是 一 直 运 行 ? 用 一 种 特定 的 语言 解决 一 个 问题 
需要 多 长 时 间 ? 为 了 回答 这 些 问 题 ， 我 们 求助 于 一 门 学 科 : 计算 理论 。 
目标 
。 通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 
描述 我 们 称 为 简单 语言 的 编程 语言 ， 并 定义 它 的 基本 语句 ; 
在 简单 语言 中 ， 使 用 简单 语言 的 复合 写 出 宏 ; 
描述 作为 计算 机 模型 的 图 灵机 的 构成 ; 
使 用 图 灵机 ， 显 示 简 单 语 言 中 的 简单 语句 是 如 何 被 模拟 的 ; 
理解 印 奇 - 图 灵 理 论 和 它 的 含义 ; 
定义 歌德 尔 数 和 它 的 应 用 ; 
理解 停机 问题 的 概念 和 问题 不 可 解 是 如 何 被 证 明 的 ; 
区 分 可 解 和 不 可 解 问题 ; 
区 分 多 项 式 和 非 多 项 式 可 解 问题 。 


17.1 引言 


这 一 章 是 对 计算 理论 的 一 个 简要 的 介绍 。 首 先 ， 介 绍 一 种 语言 ， 称 为 简单 语言 ， 通 过 它 
可 以 看 到 计算 机 解决 任何 问题 所 需要 的 最 少 语句 是 三 条 。 其 次 ， 介 绍 另 一 种 工具 ， 一 种 称 为 
图 灵机 的 计算 机 模型 ， 我 们 在 第 1 章 中 提 到 过 它 。 我 们 将 看 到 ， 简 单 语言 可 以 解决 的 问题 也 
可 以 用 图 灵机 解决 。 第 三 ， 我 们 将 证 明 没有 任何 程序 可 以 知道 另 一 个 程序 终止 与 否 。 证 据 本 
身 表明 有 些 问 题 计算 机 是 无 法 解决 的 ， 最 后 简要 地 讨论 算法 的 复杂 性 。 本 章 中 描绘 的 思想 来 
自 于 计算 机 科学 界 的 先驱 们 ， 如 阿兰 . 图 灵 ( Alan Turing)、 库 尔 特 : 哥 德 尔 ( Kurt G6del)、 
马 文明 斯 基 (Marvin Minsky)、 阿 隆 佐 ' 印 奇 ( Alonzo Church) 和 斯 带 芬 . 科 尔 。 克 莱 尼 
(Stephen Cole Kleene)。 


17.2 简单 语言 


我 们 可 以 仅 用 三 条 语句 来 定义 一 种 语言 ， 它 们 是 : 递增 语句 、 递 减 语句 和 循环 语句 
(图 17-1 )。 在 该 语言 中 ， 只 能 使 用 非 负 整数 数据 类 型 。 这 里 不 需要 其 他 类 型 数据 ， 因 为 本 
章 的 目标 仅仅 是 说 明 计算 理论 中 的 一 些 思想 。 该 语 ce 

言 只 使 用 少数 的 几 个 符号 ， 如 拉 ”和 “j。 语句 


17.2.1 ”递增 语句 
递增 语句 对 变量 加 1。 其 格式 显示 在 算法 17.1 中 。 图 17-1 简单 语言 的 语句 
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算法 17.1 ”递增 语句 


incr (XxX) 


17.2.2 ”递减 语句 
递减 语句 从 变量 中 减 1。 其 格式 显示 在 算法 17.2 中 。 
算法 17.2 ”递减 语句 
decr (X) 
17.2.3 ”循环 语句 


循环 语句 是 在 变量 的 值 不 为 0 时， 重复 进行 一 个 动作 (或 一 系列 动作 )。 其 格式 显示 在 
算法 17.3 中 。 


算法 17.3 ”循环 语句 


while (xX) 
{ 

decr (X) 

Body of the loop 
} 


17.2.4 简单 语言 的 威力 


归纳 来 说 ， 可 以 证 明 只 使 用 这 三 种 语句 的 简单 程序 设计 语言 和 我 们 现在 使 用 的 任何 一 种 
复杂 语言 (比如 C) 一 样 强大 (虽然 从 效率 来 说 不 一 定 )。 为 了 证 明 这 一 点 ， 可 以 演示 一 下 如 
何 模拟 当今 流行 语言 中 的 某 些 语句 。 

1. 简单 语言 中 的 宏 

我 们 把 每 次 模拟 称 为 一 个 宏 ， 并 且 在 其 他 模拟 中 使 用 时 不 需要 再 重复 其 代码 。- 一 个 安 
(macro，macroinstruction 的 简称 ) 是 高 级 语言 中 的 一 条 指令 ， 它 等 价 于 相同 语言 中 的 一 条 或 
多 条 指令 的 特定 集合 。 

(1) 第 一 个 宏 : + 0 

算法 17.4 给 出 了 如 何 用 简单 语言 的 语句 来 给 一 变量 雹 赋值 为 0。 有 时 叫做 清空 变量 。 


算法 17.4 宏 XY 二 0 


while(X) 
{ 
decr (X) 
} 
(2 ) 第 二 个 宏 : Xn 
算法 17.5 给 出 了 如 何 用 简单 语言 的 语句 将 一 正 整数 赋值 给 变量 X。 首 先 清空 变量 工 ， 然 
后 对 于 递增 nn 次 。 
算法 17.5 宏一) 
X 一 0 


incr (X) 
incr (X) 
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incr (X) // incr(X) 语句 表明 重复 n 次 


(3 ) 第 三 个 宏 : 了 一世 
算法 17.6 模拟 了 简单 语言 中 的 宏 了 + 对 ， 注 意 我 们 可 以 用 额外 的 代码 行 来 恢复 对 的 值 。 


算法 17.6 ” 宏 Y 二 区 
Y*—0 
while (X) 
{ 
decr (X) 
incr (Y) 


} 
(4) 第 四 个 宏 : YY 了 + 子 


算法 17.7 模拟 了 简单 语言 中 的 宏 了 + 了 + X， 我 们 同样 可 以 用 额外 的 代码 行 来 恢复 XX 的 
值 ， 使 其 恢复 为 原始 的 值 。 


算法 17.7 宏 YeY+X 


while (xX) 

{ 
decr (X) 
incr (Y) 


} 


(5 ) 第 五 个 宏 : YYXX 

算法 17.8 模拟 了 简单 语言 中 的 宏 了 < YXX。 我 们 可 以 使 用 加 法 宏 ， 因 为 整数 的 乘法 可 
以 用 重复 的 加 法 来 模拟 。 注 意 ， 我 们 需要 把 匀 的 值 保存 在 一 个 临时 变量 中 ， 因 为 在 每 次 的 加 
法 中 ,我 们 需要 把 外 的 原始 值 加 到 了 上 。 


算法 17.8” 宏 YY XX 


TEMP 人 一 Y 
YY 二 0 
while(X) 
{ 

decr (X) 

Y 一 Y+TEMP 
} 


(6) 第 六 个 宏 : 了 YY” 
算法 17.9 模拟 了 简单 语言 中 的 宏 了 二 YY。 我 们 使 用 乘法 宏 来 完成 它 ， 因 为 整数 的 指数 
可 以 用 重复 的 乘法 来 模拟 。 


算法 17.9 宏 了 7 二 殉 


TEMP <—Y 

芝 二 一 灿 

while (X) 

{ 
decr (XI) 
Yt YXTEMP 
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(7 ) 第 上 个 宏 : ifXthen A 
算法 17.10 模拟 了 简单 语言 中 的 第 七 个 宏 ， 这 个 宏 模 拟 了 现代 语言 中 的 判断 语句 (if)。 
在 这 个 宏 中 ,变量 碟 的 值 只 能 是 0 或 1 这 两 个 值 之 间 的 一 个 。 如 果 逆 的 值 不 是 0， 在 循环 中 
A (一 个 动作 或 一 系列 动作 ) 被 执行 。 但 是 该 循环 只 执行 一 次 ， 因 为 第 一 轮 执 行 完毕 后 的 
值 变 成 0， 从 而 跳出 循环 。 如 果 无 的 值 是 0， 循环 被 跳 过 。 
算法 17.10 宏 ifxXthenA 


while (X) 

{ 
decr (X) 
A 

} 


(8 ) 其 他 宏 

很 显然 ,我们 需要 更 多 的 宏 来 使 简单 语言 与 现代 语言 相 匹配 。 建 立 其 他 宏 是 可 能 的 , 但 
却 并 不 简单 。 

2. 输入 和 输出 

在 简单 语言 中 ，Read 蕊 语句 可 以 使 用 (无 二 ) 来 模拟 ， 我 们 也 可 模拟 输出 ， 即 假定 程 
序 中 使 用 的 最 后 一 个 变量 保存 着 将 要 打印 的 数据 。 记 住 这 不 是 实际 的 语言 ， 而 是 仅仅 用 来 证 
明 计 算 机 科学 中 的 一 些 定理 。 


17.3 图 灵机 


图 灵机 是 在 1936 年 由 Alan M.Turning 提出 用 来 解决 可 计算 问题 的 。 它 是 现代 计算 机 的 
基础 。 在 本 章 中 我 们 将 用 图 灵机 的 一 个 非常 简单 的 版 本 来 说 明 它 是 如 何 工作 的 。 


17.3.1 图 灵机 组 成 部 件 


图 灵机 由 三 部 分 组 成 : 磁带 、 控 制 器 和 
读 / 写 头 (如 图 17-2 所 示 )。 
+ 确 枯 
尽管 现代 计算 机 中 使 用 的 随机 存储 设备 型 
容量 是 有 限 的 ， 但 我 们 假定 图 灵机 中 的 内 存 图 17-2 图 灵机 
是 无 限 的 。 磁 带 任何 时 候 只 能 保存 一 系列 顺序 字符 ， 该 字符 来 自 计 算 机 所 能 接收 的 字符 集 
中 。 为 了 我 们 的 目的 ， 假 设 图 灵机 只 能 接收 两 个 符号 : 空白 (b) 和 数字 1。 图 17-3 给 出 了 
这 种 机 器 磁带 记录 数据 的 一 个 例子 。 
左手 的 空白 定义 了 存储 在 磁带 上 的 非 负 
整数 的 开始 ， 一 个 整数 用 1 构成 的 串 表示 。 磁带 
右手 的 空白 定义 了 整数 的 结束 。 磁 带 的 其 他 图 17-3 图 灵机 中 的 磁带 
部 分 包含 了 空白 字符 。 如 磁带 上 存 有 多 个 整数 ， 它 们 用 至 少 一 个 空白 字符 隔 开 。 
此 外 ， 还 假设 磁带 处 理 一 元 算术 中 的 正 整数 。 在 一 元 算术 中 ， 正 整数 仅 由 1 组 成 。 例 
如 ， 整 数 4 表示 为 1111 (4 个 1 )，7 表示 为 1111111 (7 个 1), 没有 1 的 地 方 表示 0。 
2. 读 / 写 头 
读 / 写 头 任何 时 刻 总 是 指向 磁带 上 的 一 个 符号 ， 我 们 称 这 个 符号 为 当前 符号 ， 读 / 写 头 
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每 次 在 磁带 上 读 写 一 个 符号 。 每 读 写 完 一 次 后 ， 它 向 左 移 、 向 右 移 。 读 、 写 和 移动 都 是 在 控 
制 器 指令 下 进行 的 。 。 

3. 控制 器 

控制 器 是 理论 上 功能 作用 类 似 于 现代 计算 机 中 央 处 理 单元 (CPU) 的 一 个 部 件 ， 它 是 一 
个 有 限 状 态 自动 机 ， 即 该 机 器 有 预定 的 有 限 个 状态 并 能 根据 输入 从 一 个 状态 转移 到 另 一 个 状 
态 ， 但 任何 时 候 它 只 能 处 于 这 些 状 态 中 的 一 种 。 

图 17-4 给 出 了 简单 控制 器 作为 有 限 状 态 自动 机 控制 器 的 状态 转移 图 。 在 这 个 图 中 ， 自 
动机 有 三 个 状态 (A、B 和 C)， 虽 然 控制 器 通常 有 很 多 状态 。 图 中 给 出 了 读 入 字符 后 所 引起 
状态 的 改变 。 每 一 行 上 的 表达 式 (x/y/L、x/y/R 和 x/y/N) 显示 了 : 控制 器 读 人 x* 后 ， 它 写 符 
号 y (改写 x)， 并 将 读 / 写 头 移 到 左边 (L)、 右 边 (R) 或 不 动 (N)。 注 意 既 然 磁 带 上 的 符号 
只 有 空白 或 数字 1， 那 么 从 每 个 状态 出 去 的 路 径 只 有 两 条 : 要 么 读 到 的 是 空白 符号 ,要么 读 
到 的 是 数字 1。 线 ( 称 为 转移 线 ) 的 起 点 显示 的 是 当前 状态 ， 线 的 末端 (箭头 ) 显示 的 是 一 
下 状态 。 

x/y/R: 如 果 读 了 x, 就 写 y 并 移 到 右边 


x/y/L: 如 果 读 了 x, 就 写 y 并 移 到 左边 
x/y/N: 如 果 读 了 x, 就 写 y 但 不 移动 


_ A HR State 0 


二 State C ux | 


图 17-4 图 灵机 中 的 状态 转移 图 


b/b/R 









我 们 可 以 建立 一 个 每 一 行 代表 一 个 状态 的 状态 转移 表 ( 表 17-1 )。 表 有 5 栏 : 当前 状态 、 
读 人 符号 、 所 写 符 号 、 读 / 写 头 的 移动 方向 和 下 一 个 符号 。 既 然 机 器 只 能 经 历 有 限 个 状态 ， 
那么 我 们 能 创建 一 个 像 我 们 在 第 5 章 中 为 简单 计算 机 建立 的 指令 集 。 


表 17-1 状态 转移 表 





指令 是 把 一 行 中 的 5 列 值 放 在 一 起 ， 对 于 这 人 台 初 级 的 机 器 ， 我 们 只 有 6 条 指令 : 


is (A by bs BB 2B) 3. (B, b, 1, R, B) 5 (CG, b; bb, Ti A) 
2. (A, 1, 1, R, B) 4. (B, 1, b, N, C) 6 (Cy LB BB 


例如 ， 第 一 条 指令 是 说 : 如 果 机 器 处 于 状态 A， 读 到 了 符号 b， 它 就 用 一 个 新 的 b 改写 符 
号 , 读 / 写 头 向 右 移 到 下 一 个 符号 上 ， 机 器 的 状态 转移 到 状态 A， 也 就 是 保留 在 相同 的 状态 中 。 
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例 17.1 一 个 图 灵机 只 有 两 个 状态 和 如 下 的 4 条 指令 : 


1. (A, b, b, L, A) 2. (A, 1, 1, R, B) 3. (B; b; b, L, A) 
4. (B, 1, b, R, A) 


如 果 机 器 用 图 17-5 所 示 的 配置 开始 。 这 是 在 执行 完 上 一 条 指令 后 的 机 器 配置 。 注 意 机 
器 只 能 执行 一 条 指令 ， 它 满足 当前 状态 和 当前 符号 。 





图 17-5 例 17.1 


解 ”机 器 是 处 于 状态 A， 当 前 符号 是 1， 这 就 意味 着 只 有 第 二 条 指令 (A，1，1，R，B) 
能 被 执行 。 新 的 配置 也 在 图 17-5 中 显示 。 注 意 控制 器 的 状态 已 经 变 成 了 B， 读 / 写 头 已 经 向 
右 移动 了 一 个 符号 。 


17.3.2 ”对 简单 语言 的 模拟 


我 们 现在 能 编写 程序 来 实现 简单 语言 的 语 名 了。 注意 这 些 语句 可 以 用 多 种 方法 来 写 ， 为 
了 学 习 的 目的 ， 我们 选择 了 最 简单 或 最 方便 的 ， 但 它们 不 一 定 是 最 好 的 。 

1. 递增 语句 

图 17-6 显示 了 incr(X) 语句 的 图 灵机 。 控 制 器 有 4 个 状态 ， 从 Si1 到 S4， 状 态 Si 是 开始 
状态 ， 状 态 Ss 是 右 移 的 状态 ， 状 态 $3 是 左 移 的 状态 ， 状 态 S4 是 停机 状态 。 如 果 到 达 停 止 状 
态 ， 机 器 就 停止 : 没有 指令 从 这 个 状态 开始 。 

图 17-6 还 显示 了 incr(X) 语句 的 程序 。 它 有 5 条 指令 。 过 程 从 X (要 加 !1 的 数据 ) 左边 
的 空白 符号 开始 ， 向 右 移 过 所 有 的 1， 直 到 到 达 X 右边 的 空白 符号 。 它 把 此 空白 改 成 1。 它 
再 向 左 移 过 所 有 的 1， 直 到 又 一 次 到 达 左 边 的 空白 。 在 这 点 上 它 停机 。 注 意 我 们 也 给 出 了 移动 
读 / 写 头 回 到 X 左边 空白 符号 的 程序 ， 如 果 在 X 上 有 多 个 操作 要 进行 ， 这 个 程序 是 需要 的 。 


Si: 开始 LIAR 

S;: 右 移 b/b/R 

S;: 左 移 

S,: 停机 b/1L 





UUL 
图 17-6 语句 incr(X) 的 图 灵机 


例 17.2 显示 图 灵机 如 何 使 X 递增 的 , 这 里 X=2。 

解 图 17-7 显 示 了 解 。X 的 值 (在 一 元 系统 中 为 11 ) 存储 在 两 个 空白 符号 之 间 。 它 使 
用 了 7 个 步骤 使 X 递 增 ， 并 且 读 / 写 头 回 到 原先 的 位 置 。 第 1 步 到 第 4 步 把 读 / 写 头 移 到 X 
的 末端 ， 第 5 步 到 第 7 步 改变 末 端的 空白 和 把 读 / 写 头 移 回 它 原先 所 在 的 位 置 。 

2. 递减 语句 

我 们 使 用 最 小 的 指令 数目 来 实现 decr(X) 语句 。 原 因 是 我 们 在 下 一 条 语句 ( while 循环 ) 


310 和 莲 17 葬 


中 要 用 到 这 个 语句 ， 它 也 被 用 来 实现 所 有 的 宏 。 图 17-8 显示 了 这 条 语句 的 图 灵机 。 控 制 器 
有 三 个 状态 : S1、Sz 和 S3。 状 态 Si 是 开始 状态 ， 状 态 S: 是 检查 语句 ， 它 检查 当前 符号 是 1 
还 是 b。 如 果 是 b， 语 句 进 入 停机 状态 ; 如 果 下 一 个 符号 是 1， 第 二 条 语句 把 它 改 成 b， 然 后 
再 进入 停机 状态 。 图 17-8 还 显示 了 这 条 语句 的 程序 。 


‘GS b, b, R, S,) (S,, 1, 1, R, 8,) :| (S, 1 1,R,S)) ! :| ed i : 


D LE | En 


hl 


(S;, 1, 1, R, S$,) i (Sb b, N, S,) 


了 mreer ee -mr Sn 





图 17-8 decx(X) 语句 的 图 灵机 


例 17.3 显示 图 灵机 如 何 使 X 递减 的 ， 这 里 X=2。 

解 图 17-9 显示 了 解 。 机 器 从 数据 左边 的 空白 开始 ， 如 果 下 一 个 符号 为 1， 机 器 把 它 
改 成 空白 。 读 / 写 头 停止 在 结果 数据 左边 的 空白 字符 上 。 这 是 与 递增 语句 中 的 相同 安排 。 注 
意 我 们 可 能 已 经 把 读 / 写 头 移 到 数据 的 末端 ， 删 除了 最 后 的 1， 而 不 是 第 一 个 1。 但 这 个 程 
序 比 我 们 的 版 本 要 长 得 多 。 因 为 我 们 在 每 个 循环 语句 中 都 需要 这 条 语句 ， 所 以 我 们 使 用 了 简 
短 的 版 本 来 节省 指令 的 数目 。 我 们 在 下 一 节 要 介绍 的 while 循环 语句 中 使 用 了 这 条 语句 的 简 
短 版 本 。 





'(S,b,b,R,S,) | (8, bb,N,S) ， 
TT THT ， 
nl td We nd 
图 17-9 例 17.3 


3. 循环 语句 

为 了 模拟 循环 ， 我 们 假定 X 和 循环 体 处 理 的 数据 存储 在 磁带 上 ， 中 间 以 单个 空白 符号 
相隔 。 图 17-10 显示 了 通常 循环 语句 的 表 、 程 序 和 状态 转移 图 。 

三 个 状态 SI; 、S: 和 S; 控制 了 循环 ， 它 通过 判断 X 的 值 ， 如 果 X=0， 就 退出 循环 。 把 这 
三 个 状态 与 图 17-8 中 递减 语句 中 使 用 的 三 个 状态 进行 比较 。 状 态 Ma 把 读 / 写 头 移 过 在 每 次 
重复 中 在 处 理 数据 开始 时 定义 了 数据 开始 位 置 的 空白 符号 ; 状态 Mr 把 读 / 写 头 移 过 在 每 次 
重复 中 在 处 理 数据 结束 时 定义 了 X 的 开始 位 置 的 空白 符号 ; 状态 Bs 定义 了 循环 体 的 开始 状 
态 ， 而 状态 Bg 定义 了 循环 体 的 停机 状态 。 循 环 体 在 这 两 个 状态 间 可 能 有 几 个 状态 。 
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图 17-10 还 显示 了 语句 的 重复 性 质 。 状 态 图 本 身 是 一 个 只 要 X 的 值 不 为 0 就 重复 的 循 
环 。 当 X 的 值 变 成 0， 循环 停止 ， 状态 S; (停机 状态 ) 到 达 了 。 


程序 
(S,, b, b, R, S;) D 






B。: 循环 体 的 开始 状态 
: 循环 体 的 停机 状态 





图 17-10 while 循环 语句 的 图 灵机 


例 17.4 ”让 我 们 显示 一 个 非常 简单 的 例子 。 假 设 我 们 要 模拟 第 四 个 宏 ,，Y 一 Y+X。 像 
我 们 前 面 讨论 的 一 样 ， 这 个 宏 可 以 用 简单 语言 中 的 while 语句 来 模拟 : 
while (XxX) 
{ 
decr (XI) 
incr (Y) 


} 

为 了 使 过 程 简 短 ， 我 们 假设 X=2 和 Y=3。 因 此 ， 结 果 是 Y=5。 图 17-11 显示 了 应 用 宏 
之 前 和 之 后 磁带 的 状态 。 注 意 : 在 这 个 程序 中 我 x Y 
们 消除 了 X 的 值 ， 使 得 过 程 更 简短 。 但 如 果 我 
们 在 磁带 上 允许 其 他 符号 ，X 的 原始 值 是 可 以 保 之前 
存 的 。 广 一 一 一 一 
因为 X=2， 程 序 重复 两 次 。 第 一 次 重复 结 


之 后 
十 ，X=1，Y=4。 2 结束 时 ，X=0， 
图 17-11 例 17.4 的 磁带 配置 


17.3.3 ” 邱 奇 - 图 灵 论 题 


我 们 显示 了 图 灵机 能 模拟 简单 语言 中 的 三 个 基本 语句 。 这 就 意味 着 图 灵机 能 模拟 我 们 为 
简单 语言 定义 的 所 有 的 宏 。 那 么 图 灵机 是 否 能 解决 一 台 计算 机 能 解决 的 任何 问题 ?这 个 问题 
的 答案 可 以 在 印 育 - 图 灵 论 题 (Church-Turing thesis) 中 找到 。 
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邱 奇 - 图 灵 论题 ， 和 





NR 0 

基于 这 样 的 观点 ， 能 用 写 一 个 算法 来 完成 的 任何 符号 操纵 任务 也 可 以 用 图 灵机 完成 。 注 
意 这 只 是 论题 ， 不 是 定理 。 定 理 可 以 在 数学 上 得 到 证 明 ， 但 论题 却 不 能 。 虽 然 这 个 论题 可 能 
永远 得 不 到 证 明 ， 但 有 些 强 有 力 的 论断 在 支持 它 。 首 先 ， 尚 未 发 现 有 图 灵机 不 能 模拟 的 算 
法 ; 其 次 ， 所 有 在 数学 上 已 经 得 到 证 明 的 计算 机 模型 都 与 图 灵机 模型 等 价 ， 这 个 论断 是 得 到 
证 明 的 。 


17.4 歌德 尔 数 


在 计算 机 科学 理论 中 ， 一 个 无 符号 数 能 被 分 配给 任何 用 特定 语言 编写 的 程序 ， 通 常 称 为 
歌德 尔 数 (用 澳大利亚 数学 家 Kurt G6del 命名 )。 

这 种 分 配 有 很 多 优点 。 首 先 ， 程 序 可 以 作为 单一 数据 项 输入 给 其 他 程序 。 第 二 ， 程 序 
可 以 通过 它 的 整数 表示 来 引用 。 第 三 ， 该 编号 方式 可 以 用 来 证 明 有 一 些 问题 计算 机 并 不 能 解 
决 ， 从 而 说 明 世 界 上 问题 的 数量 远 远 比 曾 经 编写 的 程序 数量 要 多 得 多 。 

各 种 各 样 的 方法 被 设计 用 来 给 程序 编号 。 我 们 用 一 个 简单 的 变换 给 用 简单 语言 编写 的 程 
序 编号 。 假 定 简单 语言 仅 使 用 15 个 标志 符 ( 表 17-2 )。 

注意 ,在 这 种 语言 当中 仅 使 用 X，Xi，Xz，…，Xs 作为 变量 。 为 了 将 变量 编码 ， 将 X， 
看 成 是 由 X 入 两 个 符号 组 成 来 处 理 (X; 是 由 X 和 3 组 成 )。 如 果 在 宏 中 有 其 他 类 型 变量 ， 
应 将 它们 转换 为 X, 的 形式 。 


- 台 完成 这 个 任务 的 


表 17-2 简单 语言 中 符号 的 编码 


LT | ll ， 
”| | | 
| | 
， 
5 
| 
: 
0 


17.4.1 表示 一 个 程序 


运用 这 个 表 ， 我 们 可 以 通过 唯一 的 正 整数 表示 用 简单 语言 编写 的 任何 程序 。 按 照 以 下 步 
又 进行 : 

1 ) 将 每 一 个 符号 用 表 中 所 给 的 对 应 十 六 进 制 代码 替代 。 

2 ) 将 最 后 的 结果 (十 六 进 制 ) 转化 为 无 符号 整数 。 

例 17.5 ”对 于 程序 incr(X) 来 说 ， 什 么 是 歌德 尔 数 呢 ? 

解 ”用 对 应 的 十 六 进 制 代码 替代 每 个 符号 : 


incr X 一 (ARAEF)i6 一 175 
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所 以 ， 这 个 程序 可 以 用 数字 175 表述 。 


17.4.2 ”翻译 一 个 数字 


为 了 证 明 编 号 方式 是 唯一 的 ， 用 以 下 步骤 来 解释 歌德 尔 数 : 

1 ) 将 数字 转换 成 十 六 进 制 数 。 

2 ) 用 表 17-2 将 每 个 十 六 进 制 数 翻译 成 对 应 的 符号 (忽略 0 )。 

注意 ， 虽 然 用 简单 语言 编写 的 一 切 程序 都 能 用 数字 表述 ， 但 是 ， 并 不 是 所 有 的 数字 都 能 
解释 为 合法 程序 。 转 换 之 后 ， 如 果 符 号 不 符合 语法 规则 ， 这 个 数字 就 不 是 有 效 的 程序 。 

例 17.6 将 3058 翻译 成 程序 。 

解 ”将 数字 变 成 十 六 进 制 数 并 用 相应 的 符号 代替 : 


3058 一 (BF2)li6 一 qdqecr X2 一 decr (X;) 


这 意味 着 在 简单 语言 中 的 等 价 代码 是 decr(X2)。 注 意 ， 在 简单 语言 中 ， 每 个 程序 都 包括 
输入 和 输出 。 这 意味 着 程序 和 它 的 输入 的 组 合 定义 了 歌德 尔 数 。 


17.5 ”停机 问题 


几乎 所 有 的 简单 语言 编写 的 程序 都 包含 某 种 形式 的 重复 (循环 或 递归 函数 )。 一 个 重复 
结构 可 能 永远 都 不 会 结束 (停机 ) ; 这 就 是 说 ， 一 个 含有 无 限 循环 的 程序 可 以 永远 运行 。 例 
如 ， 下 面 的 用 简单 语言 编写 的 程序 可 以 永 不 结束 。 

I 

while (xX) 

{ 

} 

一 个 典型 的 编程 问题 是 : 

人 们 能 编写 一 个 程序 来 测试 任何 可 以 用 歌德 尔 数 表示 的 程序 是 否 会 终 

该 程序 的 存在 将 会 节省 编程 人 员 的 大 量 时 间 ， 运行 一 个 程序 而 不 知道 它 是 否 可 以 终止 是 一 

项 枯燥 乏味 的 工作 。 不 幸 的 是 ， 现 在 已 经 证 明 这 样 的 程序 不 可 能 存在 (编程 人 员 的 最 大 失望 )。 


停机 问题 是 不 可 解决 的 


当 谈 到 这 样 的 测试 程序 不 存在 而 且 永 远 不 会 存在 时 ,计算 机 科学 家 们 会 说 :“ 停 机 问题 
是 不 可 解决 的 ”。 

证 明 

下 面 给 出 这 样 的 测试 程序 不 存在 的 一 个 非 正式 证 明 。 我 们 的 方法 在 数学 中 经 常 使 用 : 这 
就 是 反 证 法 。 我 们 假设 这 样 的 程序 存在 ， 然 后 证 明 它 的 存在 将 产生 一 个 矛盾 ， 因 此 它 不 可 能 
存在 。 我 们 用 下 面 三 个 步骤 给 出 该 方法 的 证 明 过 程 。 

(1 ) 第 一 步 

.在 此 步骤 中 假设 存在 一 个 命名 为 Test 的 程序 ， 它 能 接收 其 他 任何 程序 ， 例 如 P， 用 它 的 
歌德 尔 数 表示 作为 输入 ， 并 且 输 出 为 1 或 0。 如 果 了 终止 ， 则 Test 程序 输出 为 1 ; 如果 了 P 没 
有 终止 ， 则 Test 程序 输出 为 0 (图 17-12 ) 。 

(2 ) 第 二 步 

在 这 一 步 中 ， 我 们 创建 另 一 个 程序 ， 叫 做 Strange， 它 由 两 部 分 组 成 : 开始 为 程序 Test 
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的 副本 ,末尾 是 一 个 空 循环 (用 一 个 空 体 循环 ) 。 循 环 用 X 作为 测试 变量 ， 它 实际 上 是 程序 
Test 的 输出 。 这 个 程序 也 用 P 作为 输入 。 我 程序 P 
们 之 所 以 称 这 个 程序 为 Strange 是 因为 以 下 原 ( 歌德 尔 数 ) 

让 

如 果 P 终 止 eh 

止 。 如 果 P 不 终止 ,程序 的 第 一 部 分 ( Test 程 
序 的 副本 ) 输出 0。 该 0 输入 循环 体 ,循环 终 | 
止 ( 它 现在 是 一 个 有 限 循环 ， 循 环 从 未 重复 )， 国 17"12 证明 第 一 步 


因 : 如 果 P 终止 程序 的 第 一 部 分 ( Test 程序 
的 副本 ) 输出 1 ,该 1 输入 循环 体 ， 循 环 不 终 
止 〈 无 限 循 环 )， 相 应 的 程序 Strange 也 不 会 终 

随后 ， 程 序 Strange 终止 。 换 名 话说， 我 们 有 以 下 奇怪 的 情形 : 
如 果 了 终止 ，Strange 不 终止 
如 果 了 不 终止 ，Strange 终止 


Strange 


程序 P (1 0) while X sae ; 
( 歌德 尔 数 ) { 如 果 P 不 终止 ， 
} Strange 终 止 








图 17-13 ”给 出 证 明 的 第 二 步 


(3 ) 第 三 步 

已 经 编写 了 Strange 程序 。 我 们 用 程序 自身 ( 它 的 歌德 尔 数 ) 作为 输入 来 测试 它 ， 这 是 
合法 的 ， 因 为 我 们 没有 给 程序 P 任何 约束 条 件 。 图 17-14 给 出 了 此 种 情况 的 示意 图 。 

矛盾 


假设 程序 rest 存在 ， 我 们 得 到 以 下 的 矛盾 : 
如 果 程 序 Strange 终止 ， 则 程序 Strange 不 终止 。 
如 果 程 序 Strange 不 终止 ， 则 程序 Strange 终止 。 


Strange 


程序 P (l or 0) |while X 
( 歌德 尔 数 ) : { 
} 





图 17-14 ”证 明 第 三 步 
这 证 明 Test 程序 不 存在 ， 我 们 应 停止 查找 该 程序 ， 所 以 …… 


停机 问题 无 法 解决 。 、 Ss 守 2 3 
停机 问题 的 不 可 解决 性 已 经 证 明 了 许多 其 他 问题 也 是 不 可 解 的 ， 因为 如 果 它们 可 解 ， 那 
么 停机 问题 也 可 解 ， 而 停机 问题 却 不 可 解 。 


17.6 ”问题 的 复杂 度 


既然 我 们 已 经 证 明 : 至 少 有 一 个 问题 计算 机 无 法 解决 ,那么 让 我 们 在 这 个 问题 上 再 进 一 
步 深 入 。 在 计算 机 科学 领域 ， 我 们 可 以 这 么 说 ， 一 般 来 说 问题 可 以 分 为 两 类 : 可 解 问题 和 不 
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可 解 问题 。 可 解 问题 又 可 以 分 为 两 种 : 多 项 式 问题 和 非 多 项 式 问题 (图 17-15 )。 
17.6.1 不 可 解 问题 


无 法 用 计算 机 解决 的 问题 有 无 穷 无 尽 ， 

停机 问题 是 其 中 一 个 。 要 证 明 一 个 问题 是 无 

法 解决 的 ， 方 法 是 证 明 如 果 它 可 以 解决 ， 那 
| 非 多 项 式 的 | 非 多 项 式 的 

么 停机 问题 也 同样 可 以 解决 ， 换 名 话说， 证 

明 一 个 问题 能 否 解决 等 同 于 证 明 停机 问题 能 因 19-15， 风 题 的 内江 

否 解决 。 


17.6.2 ”可 解 问题 


能 够 被 计算 机 解决 的 问题 也 是 无 穷 无 尽 ， 平 常 我 们 关心 的 是 : 计算 机 需要 花 多 长 时 间 去 
解决 一 个 问题 。 换 言 之 ， 这 个 问题 有 多 复杂 ? 

问题 的 复杂 度 可 以 用 不 同 的 方法 衡量 ， 例 如 ， 运 行 时 间 、 需 要 的 内 存 等 。 其 中 一 种 衡量 
方法 是 运行 时 间 ， 即 运行 一 个 程序 需要 花 多 长 时 间 ? 

可 解 问题 的 复杂 度 

衡量 可 解 问题 复杂 度 的 一 个 方法 是 找 出 计算 机 运行 该 程序 时 要 执行 的 运算 数量 。 这 样 ， 
复杂 度 问 题 不 是 依赖 于 运行 程序 的 计算 机 速度 ， 而 是 依赖 于 输入 的 数目 。 例 如 ， 如 果 程 序 在 
处 理 一 个 列表 〈 例 如 对 列表 中 元 素 进 行 排序 )， 则 复杂 度 依 赖 于 该 列表 中 元 素 的 数目 。 

(1) 大 O 表示 法 

相对 于 当今 计算 机 的 速度 ， 我 们 关心 的 是 程序 总 体 的 数量 级 而 不 是 精确 的 数字 。 例 如 ， 
如 果 对 两 个 程序 的 分 析 显 示 : 其 中 一 个 执行 15 个 运算 (或 一 组 运算 )， 另 一 个 执行 25 个 ， 
它们 都 运行 得 很 快 ， 以 致 于 看 不 出 有 什么 不 同 。 但 假设 运算 数量 是 15 比 1500， 我们 就 应 该 
考虑 它 了 。 

效率 的 简化 以 大 O 表示 法 最 为 著名 。 在 这 里 ， 只 给 出 该 表示 法 的 思想 并 不 深入 研究 
它 的 正式 定义 和 计算 。 在 该 表示 法 中 ， 运 算数 量 (或 一 系列 相关 运算 ) 表示 为 输入 量 的 
函数 。 符 号 O(n) 表示 有 nn 个 输入 ， 执行 n 次 运算 ; 符号 O(n”) 表示 有 个 输入 ， 执 行 玫 次 
运算 。 

例 17.7 假设 编写 了 三 个 不 同 的 程序 来 解决 同一 问题 ,第 一 个 程序 复杂 度 为 
O(LOG1o")， 第 二 个 程序 复杂 度 是 O(n)， 第 三 个 程序 复杂 度 是 O(n”)。 假 设 输入 为 100 万 ， 
那么 在 一 台 一 条 指令 执行 时 间 为 1 微 秒 (每 秒 100 万 次 ) 的 计算 机 上 分 别 运行 它们 ， 各 需 多 
少时 间 呢 ? 










解 ”分析 如 下 : 

第 一 个 程序 : n=1 000 000 0(logion) 一 6 Time 一 6 hs 
第 二 个 程序 : n=1 000 000 on) 一 1 000 000 Time 一 1 s 
第 三 个 程序 : n=1 000 000 0(n2?) 一 1032 Time 一 277 h 


(2 ) 多 项 式 问题 

如 果 程 序 的 复杂 度 为 O(log n)、O(n)、O(n”)、O(m*)、O(n 和 ) 或 O(n*) (大 为 常数 )， 则 
被 称 为 多 项 式 问题 。 以 当今 计算 机 的 处 理 速度 ， 对 于 一 个 有 合理 输入 数量 的 (如 从 1 000 
到 1 000 000 ) 的 多 项 式 问 题 我 们 都 能 解决 。 
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(3 ) 非 多 项 式 问题 

如 果 一 个 程序 的 复杂 度 远 比 多 项 式 问 题 复 杂 ， 例 如 O(107 或 O(n!)， 当 输入 数 很 小 (小 
于 100 ) 时 ， 这 种 问题 可 以 解决 。 如 果 输 入 数 很 大 ， 则 需要 坐 在 计算 机 面前 等 上 几 个 月 的 时 
间 才 能 看 到 非 多 项 式 问题 的 解决 结果 。 但 是 ， 随 着 计算 机 处 理 速度 的 不 断 提高 ， 我 们 也 许 能 
在 更 短 的 时 间 内 解决 非 多 项 式 问 题 。 


17.7 


章 末 材 料 


推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 


小 结 


17.8 


小 测验 


Hennie, F. Introduction to Computability, Reading, MA: Addison Wesley, 1997 
Hofstadter, D. Godel, Escher, Bach: An Eternal Golden Braid, St. Paul, MN: Vintages, 1980 
Hopcroft, J. Motwani, R. and Ullman, J. Introduction to Automata Theory, Language, 
and Computation, Reading, MA: Addison Wesley, 2006 

Kfoury, A. Moll, R. and Michael, A. A Progrmming Approach to Computability, New 
York: Springer, 1982 

Minsky, M. Computation: Finite and Infinite Machines, Engelwood Cliffs, NJ: Prentice-Hall, 
1967 

Sipser, M. Introduction the Theory of Computation, Boston, MA: Course Technology, 2005 


我 们 可 以 定义 一 种 只 有 三 种 语句 的 计算 机 语言 : 递增 语句 、 递 减 语句 和 循环 语句 。 
递增 语句 给 变量 加 1。 递 减 语句 给 变量 减 1。 循 环 语句 是 在 变量 的 值 不 为 0 时 ， 重 复 
一 个 动作 或 一 系列 动作 。 

可 以 证 明 这 种 简单 的 语言 能 模拟 一 些 流行 语言 中 的 多 个 语句 。 我 们 把 每 个 模拟 称 为 
为 一 个 宏 ， 它 可 以 在 其 他 模拟 中 使 用 ， 而 不 需要 重复 编码 。 

图 灵机 是 为 解决 可 计算 问题 而 设计 的 ， 它 是 现代 计算 机 的 基础 。 图 灵机 由 三 部 分 构 
成 : 磁带 、 控 制 器 和 读 / 写 头 。 

基于 印 奇 - 图 灵 论 题 ， 如 果 存 在 一 个 完成 符号 操纵 任务 的 算法 ， 那 么 完成 此 任务 的 
图 灵机 也 是 存在 的 。 

在 理论 计算 机 科学 中 ， 在 具体 的 计算 机 语言 中 ， 一 个 分 配给 任何 程序 的 无 符号 数 称 
为 歌德 尔 数 。 

一 个 经 典 的 编程 问题 是 能 否 构 造 一 个 可 以 预言 男 一 程序 是 否 会 结束 的 程序 。 不 幸 的 
是 已 经 证 明 这 样 的 程序 是 不 存在 的 ， 停 机 问题 是 不 可 解决 的 。 

在 计算 机 科学 中 ,问题 可 以 分 成 两 类 : 可 解 问题 和 不 可 解 问题 ， 可 解 问题 本 身 可 以 
分 为 多 项 式 问 题 和 非 多 项 式 问题 。 


练习 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 试题 。 强 烈 建议 学 生 在 继续 本 章 习 题 前 首先 


六 党 理论 


完成 相关 测验 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 在 简单 语言 中 ， 有 三 种 基本 语句 是 其 他 语句 的 基础 ， 说 出 它们 的 名 字 ， 并 描述 它们 的 功能 。 
2. 说 明 如 何 用 三 种 基本 语句 把 一 个 变量 的 值 赋 给 另 一 个 变量 。 

3. 图 灵机 和 简单 语言 间 有 何 关系 ? 

4. 说 明 图 灵机 的 组 成 和 每 一 部 件 的 功能 。 

5. 图 灵机 磁带 是 如 何 划 定数 据 界限 的 ? 

6. 当 读 / 写 头 完成 读 或 写 一 个 符号 后 ， 下 一 步 是 什么 ? 

7. 状态 转移 图 与 图 灵机 控制 器 有 何 联系 ? 

8. 转移 图 与 转移 表 有 何 联 系 ? 它们 有 相同 的 信息 吗 ? 谁 包含 的 信息 要 多 些 ? 

9. 什么 是 歌德 尔 数 ? 怎样 用 歌德 尔 数 证 明 停 机 问题 是 不 可 解决 的 ? 

10. 比较 并 区 分 多 项 式 可 解 问题 和 非 多 项 式 可 解 问题 的 复杂 度 。 


练习 题 

1. 重 写 算法 17.6 (Y 二 X)， 使 得 它 能 保存 X 的 值 。 

2. 重 写 算法 17.7， 使 得 它 在 计算 Z 一 X+Y 的 同时 能 保存 X 和 YY 的 值 。 

3. 重 写 算法 17.8， 使 得 它 在 计算 Z 二 YXX 的 同时 能 保存 X 和 YY 的 值 。 

4. 重 写 算法 17.9， 使 得 它 在 计算 Z 一 Y 的 同时 能 保存 X 和 YY 的 值 。 

5. 使 用 前 面 定 义 的 语句 或 用 简单 语言 编写 的 宏 来 模拟 下 面 的 宏 : 

YY—X 

6. 使 用 前 面 定 义 的 语句 或 用 简单 语言 编写 的 宏 来 模拟 下 面 的 宏 (X 只 能 是 0 或 1 ): 


.if (xX) then 


A> 


7. 给 定 一 台 带 有 一 条 指令 (A，1，b，R，B) 的 图 灵机 和 如 下 的 磁带 配置 ， 
! 
wa-. b 东 1 1 b wo. 
显示 出 磁带 的 最 终 配置 。 
8. 给 定 一 台 带 有 一 条 指令 (A，b，b，R，B) 的 图 灵机 和 如 下 的 磁带 配置 ， 
| 


BDl11li1liB 


显示 出 磁带 的 最 终 配 置 。 


9. 给 定 一 台 带 有 5 条 指令 (A, b, b, R, B), (B, 1, #, R, B), (B, b, b, L, C), (C, #, 


C),(C,b,，b，R，B) 的 图 灵机 和 如 下 的 磁带 配置 : 
! 


二 


显示 出 磁带 的 最 终 配置 。 
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10. 显示 给 一 个 二 进 制 中 的 非 负 整数 加 1 的 图 灵机 的 状态 图 。 例 如 ， 磁 带 的 内 容 为 (101)， 它 将 被 改 
成 (110):。 

11. 显示 图 灵机 中 对 语句 incr(X) 的 模拟 (如 本 章 定 义 的 )， 当 X= 0 时， 给 出 正确 的 答案 。 

12. 显示 图 灵机 中 对 语句 decr(X) 的 模拟 〈 如 本 章 定义 的 )， 当 X=0 时， 给 出 正确 的 答案 。 

13. 显示 图 灵机 中 对 循环 语句 的 模拟 (如 本 章 定 义 的 )， 当 我 们 允许 使 用 像 # 这 样 的 其 他 符号 时 ， 该 图 
灵机 能 改 成 可 以 保存 X 的 原始 值 。 

14. 给 出 图 灵机 模拟 宏 X 二 0 的 状态 转移 图 和 程序 。 

15. 给 出 图 灵机 模拟 宏 Y XX 的 状态 转移 图 和 程序 。 

16. 一 台 图 灵机 使 用 单个 1 来 表示 整数 0， 说明 整数 n 在 此 机 器 上 是 如 何 表 示 的 。 

17. 宏 X1 一 0 的 歌德 尔 数 是 什么 ? 

18. 宏 X: 二 2 的 歌德 尔 数 是 什么 ? 

19. 宏 X; 一 XI+ X; 的 歌德 尔 数 是 什么 ? 


小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通 过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨论 材料 的 理解 。 


| 第 18 章 


Foundations of Computer Science, Third Edition 


人 工 智 能 





在 本 书 的 最 后 一 章 中 ， 我 们 将 对 人 工 智 能 ( AI) 作 简单 的 介绍 。 第 一 节 介 绍 人 工 智 能 的 
简 史 和 定义 ， 接 下 来 的 一 节 讨 论 知 识 表示 ， 它 是 人 工 智能 中 的 一 个 广泛 介绍 且 得 到 很 好 发 展 
的 领域 。 然 后 ， 我 们 介绍 专家 系统 ， 当 需要 人 类 专家 而 专家 不 可 用 时 ， 这 些 系统 能 代替 人 类 
专家 工作 。 接 着 我 们 讨论 在 图 像 处 理 和 语言 分 析 两 个 领域 中 人 工 智 能 是 如 何 用 来 模仿 人 类 行 
为 的 。 接 着 ， 我 们 说 明 使 用 不 同 的 搜索 方法 ， 专 家 系统 和 平凡 系统 是 如 何 解决 问题 的 。 最 
后 ， 我 们 讨论 在 智能 体 中 神经 网 络 是 如 何 模仿 学 习 过 程 的 。 

目标 

通过 本 章 的 学 习 ， 学 生 应 该 能 够 : 

e 定义 和 叙述 人 工 智 能 的 简 史 ; 
描述 知识 在 智能 体 中 是 如 何 表示 的 ; 

说 明 当 人 类 专家 不 可 用 时 ， 专 家 系统 是 如 何 使 用 的 ; 

说 明 如 何 用 人 工 智 能 体 来 模仿 人 类 完成 任务 ; 

说 明 专 家 系统 和 平凡 系统 是 如 何 使 用 不 同 的 搜索 方法 解决 问题 的 ; 

说 明 人 类 的 学 习 过 程 是 如 何 被 模仿 的 ， 在 一 定 程 度 上 ， 使 用 神经 网 络 创建 的 电子 版 
神经 元 称 为 感知 器 。 


18.1 引言 


一 部 分 我 们 非 正 式 地 定义 人 工 智 能 (AI ) 这 个 词 ， 然 后 给 出 它 的 简 史 。 我 们 同时 也 定 
义 了 知 ta Sai 最 后 我 们 介绍 两 种 在 人 工 智 能 中 常用 的 编程 语言 。 


18.1.1 什么 是 人 工 智 能 


ns 站 
| 在 仿 人 类 的 活动 ， 如 






18.1.2 ”人 工 智 能 简 史 


虽然 人 工 智能 作为 一 门 独立 的 学 科 是 相对 年 轻 的 ， 但 它 还 是 经 历 了 一 段 发 展 的 时 间 。 我 
们 可 以 这 样 说 ， 当 2400 年 前 希腊 哲学 家 亚 里 多 斯 德 发 明了 逻辑 推理 这 个 概念 时 ， 人 工 智能 
就 开始 了 ， 接 着 菜 布 尼 蒋 和 牛顿 完成 了 逻辑 语言 的 定稿 。 乔 治 . 布尔 在 19 世纪 逐步 提出 的 
布尔 代数 (附录 E) 奠定 计算 机 电子 电路 的 基础 。 但 是 ， 思 维 计算 机 的 主要 思想 却 来 自 于 阿 
兰 ' 图 灵 ， 他 提出 了 图 灵 测 试 。“ 人 工 智 能 ”这 个 术语 是 John McCarthy (约翰 麦 卡 思 ) 在 
1956 年 首次 提出 的 。 


18.1.3 图 灵 测 试 
在 1950 年 ， 阿兰 .图 灵 提 出 了 图 灵 测 试 ， 这 个 测试 提出 了 机 器 具有 智能 的 一 个 定义 。 
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该 测试 的 方法 是 ， 简 单 地 比较 人 类 的 智能 行为 和 计算 机 的 智能 行为 。 一 个 询问 者 对 计算 机 和 
人 类 都 提出 一 组 问题 ， 然 后， 询问 者 得 到 两 组 答案 ,但 他 不 知道 哪 一 组 是 来 自 人 类 ， 哪 一 组 
来 自 计算 机 。 在 仔细 检查 两 组 答案 后 ， 如 果 询 问 者 不 能 肯定 地 说 出 哪 一 组 来 自 人 类， 哪 一 组 
来 自 计 算 机 ， 那 么 ,计算 机 就 通过 了 具有 智能 行为 的 图 灵 测 试 。 


18.1.4 ”智能 体 


智能 体 是 一 个 能 智能 地 感知 环境 、 从 环境 中 学 习 并 与 环境 进行 交互 的 系统 。 智 能 体 可 以 
分 成 两 大 类 ; 软件 智能 体 和 物理 智能 体 。 

1. 软件 智能 体 

软件 智能 体 是 一 组 用 来 完成 特殊 任务 的 程序 。 例 如 ， 有 些 智能 系统 能 用 来 整理 电子 邮件 
(e-mail)， 能 检查 收 到 的 邮件 的 内 容 ， 然 后 把 它们 归 到 不 同 的 类 别 中 (垃圾 、 不 重要 、 重 要 、 
非常 重要 等 )。 另 外 一 个 软件 智能 体 的 例子 是 搜索 引擎 ， 它 搜索 万 维 网 ， 发 现 能 提供 与 查询 
”主题 相关 信息 的 网 址 。 

2. 物理 智能 体 

物理 智能 体 (机 器 人 ) 是 一 个 用 来 完成 各 项 任务 的 可 编程 系统 。 简 单 的 机 器 人 可 以 用 在 
制造 行业 ， 从 事 一 些 日 常 的 工作 ， 如 装配 、 焊 接 或 油漆 。 有 些 组 织 使 用 移动 机 器 人 去 做 一 些 
日 常 的 分 发 工作 ， 如 分 发 邮件 或 明信片 到 不 同 的 房间 。 移 动机 器 人 可 以 在 水 下 探测 石油 。 

人 型 机 器 人 是 一 种 自治 的 移动 机 器 人 ， 它 模仿 人 类 的 行为 。 虽 然 人 型 机 器 人 只 在 科幻 小 
说 中 流行 ， 但 是 要 使 这 种 机 器 人 能 合理 地 与 周围 环境 交互 并 从 环境 里 发 生 的 事件 中 学 习 ， 这 
里 面 还 有 很 多 工作 要 做 。 


18.1.5 “编程 语言 


虽然 有 些 通用 语言 (如 C、C++ 和 Java) 能 用 来 编写 智能 软件 ， 但 有 两 种 语言 是 特别 为 
人 工 智能 设计 的 ， 它 们 是 : LISP 和 PROLOG。 

1. LISP 

LISP (LISt Programming) 是 约翰 * 麦 卡 思 在 1958 年 发 明 的 ， 顾名思义 ，LISP 是 一 种 
操纵 表 的 编程 语言 。LISP 把 数据 和 程序 都 当成 表 ， 这 就 意味 着 LISP 程序 能 改变 它 自身 。 这 
个 特性 与 智能 体 的 理念 相 吻 合 ， 智 能 体能 从 环境 中 学 习 并 改善 自身 行为 。 

但 是 ，LISP 的 一 个 缺点 是 它 的 行动 迟缓 。 如 果 要 处 理 的 表 比 较 长 ，LISP 就 变 得 很 慢 。 
另 一 个 缺点 是 它 的 语法 复杂 。 

2. PROLOG 

PROLOG (PROgraming in LOGic) 是 一 种 能 建立 事实 数据 库 和 规则 知识 库 的 编程 语 
言 。 使 用 PROLOG 编程 能 使 用 逻辑 推理 来 回答 那些 可 以 从 知识 库 中 推导 出 来 的 问题 。 但 是 ， 
PROLOG 不 是 一 种 效率 很 高 的 编程 语言 ， 有 些 复杂 问题 使 用 其 他 语言 (如 C、C++ 或 Java) 
来 解决 时 ， 效 率 更 高 。 


18.2 ”知识 表示 


如 果 打算 用 人 工 智 能 体 来 解决 现实 世界 中 的 一 些 问 题 ， 那 么 它 必须 能 表示 知识 。 事 实 被 
表示 成 数据 结构 后 就 能 被 存储 在 计算 机 中 的 程序 操纵 。 这 一 节 ， 我 们 描述 4 种 常见 的 知识 表 
示 方 法 : 语义 网 、 框 架 、 谓 词 逻 辑 和 基于 规则 的 系统 。 
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18.2.1 语义 网 


语义 网 是 Richard H.Richens 在 20 世纪 60 年代 提 出 的 。 语 义 网 使 用 有 向 图 表示 知识 。 
正如 在 第 12 章 讨 论 的 ， 有 向 图 由 顶点 (nodes) 和 边 (arcs) 构成 。 语 义 网 用 顶点 代表 概念 ， 
用 边 ( 用 箭头 表示 ) 表示 两 个 概念 间 的 关系 (图 18-1 )。 





图 18-1 一 个 简单 的 语义 网 


1. 概念 

为 了 给 概念 一 个 准确 的 定义 ， 专 家 们 把 概念 的 定义 与 集合 理论 联系 起 来 。 因 此 ， 概 念 被 
看 成 一 个 集合 或 一 个 子 集 。 例 如 ,“ 动 物 ” 是 所 有 动物 的 集合 ,“ 马 ”是 所 有 马 的 集合 ， 也 是 
“动物 ”的 子 集 。 对 象 是 集合 中 的 成 员 (实例 )， 概 念 用 顶点 表示 。 

2. 关系 

在 语义 网 中 ， 关 系 用 边 表示 。 一 条 边 可 以 定义 一 个 “ 子 类 ”关系 一 一 这 条 边 从 子 类 指向 超 
类 。 一 条 边 可 以 定义 一 个 “实例 ”关系 一 一 这 条 边 从 实例 指向 它 所 属 的 集合 。 一 条 边 也 可 以 定 
义 一 个 对 象 的 属性 (颜色 、 大 小 …… )。 最 后 ， 一 条 边 可 以 定义 一 个 对 象 的 所 有 权 ， 例 如 拥有 另 
外 一 个 对 象 。 语 义 网 能 很 好 定义 的 最 重要 的 关系 是 “继承 ”。 继 承 关 系 定义 明了 这 样 一 个 事实 : 
一 个 类 的 所 有 属性 将 出 现在 继承 的 类 中 。 这 可 以 用 来 从 用 图 表示 的 知识 中 推导 出 新 的 知识 。 


18.2.2 框架 


框架 与 语义 网 紧密 相关 。 在 语义 网 中 ， 图 用 来 表示 知识 ;在 框架 中 ， 数据 结构 (记录) 
用 来 表示 相同 的 知识 。 与 语义 网 相 比 ， 
框架 的 一 个 优点 是 程序 更 容易 处 理 框架 ， 
而 不 是 语义 网 。 图 18-2 显示 了 如 何 用 框 a 
















架 来 实现 图 18-1 中 的 语义 网 。 
1. 对 象 超 类 i 


语义 网 中 的 一 个 节点 变 成 了 一 组 框 
架 中 的 一 个 对 象 ， 所 以 一 个 对 象 可 以 定义 
一 个 类 、 一 个 子 类 或 类 的 一 个 实例 。 在 | 起 类 
图 18-2 中 ， 和 的 行动 物 、 哺 乳 动物 、 狗 、 
Roxy 和 Ringo 都 是 对 象 。 

2. 槽 

语义 网 中 的 边 被 翻译 成 “ 槽 ” (数据 结构 中 的 域 ) 。 槽 的 名 字 定 义 了 关系 的 类 型 和 构成 关 
系 的 槽 的 值 。 在 图 18-2 中 ， 动 物 是 爬行 动物 对 象 的 一 个 模 。 


狗 
图 18-2 一 组 框架 表示 图 18-1 中 的 语义 网 
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18.2.3 ”谓词 逻辑 

最 通常 的 知识 表示 是 谓词 远 辑 。 谓 词 逻辑 可 以 用 来 表示 复杂 的 事实 。 由 于 有 了 悠久 历 
中 的 理论 逻辑 的 支持 ,谓词 逻辑 成 为 一 门 良好 定义 的 语言 。 这 一 节 我 们 先 介绍 简单 一 些 的 语 
言 一 一 命题 逻辑 ， 然 后 再 介绍 谓词 逻辑 。 谓 词 逻 辑 使 用 了 命题 逻辑 。 


1. 命题 逻辑 

命题 逻辑 是 由 对 世界 进行 逻辑 推理 的 一 组 句子 组 成 的 一 种 语言 。 
(1 ) 运算 符 

命题 逻辑 使 用 $ 种 运算 符 ， 如 下 所 示 : 

( 非 ) (或 )” (与) (如 果 …… 那 么 ) ( 当 且 仅 当 ) 


第 一 个 运算 符 是 一 元 运算 符 (运算 符 带 一 个 句子 )， 其 他 4 个 都 是 二 元 运算 符 (运算 符 带 
两 个 句子 )。 每 个 句子 的 逻辑 值 ( 真 或 假 ) 取决 于 原子 句子 的 逻辑 值 ， 原 子 句 子 是 不 带 运算 
符 的 构成 复杂 句子 的 特殊 句子 。 图 18-3 显示 了 命题 逻辑 中 每 个 运算 符 的 真 值 表 。 真 值 表 在 
第 4 章 中 介绍 过 ， 在 附录 E 中 有 解释 。 





图 18-3 ”谓词 逻辑 中 的 5 个 运算 符 的 真 值 表 


(2 ) 句子 

这 种 语言 中 的 句子 递归 定义 如 下 : 

1 ) 大 写字 母 (如 A、B、S 或 T) 表示 在 自然 语言 中 的 一 个 语句 ， 它 们 是 一 个 句子 。 

2 ) 两 个 常数 值 ( 真 和 假 ) 中 的 任意 一 个 都 是 句子 。 

3 ) 如 果 了 是 句子 ， 则 一 了 也 是 句子 。 

4) 如 果 P 和 QQ 是 句子 , 则 PV Q、P 人 人 Q、P 一 Q 和 PQ 都 是 句子 。 

例 18.1 以 下 的 是 命题 语言 中 的 句子 : 

a. 今天 是 星期 天 (S)。 

b. 天 在 下 雨 (R)。 

c. 今天 是 星期 天 或 者 是 星期 一 (S V M)。 

d. 天 没 下 雨 (一 R)。 

e. 如 果 狗 是 哺乳 动物 ， 那 么 猫 也 是 哺乳 动物 (D 一 C)。 

(3 ) 推演 

在 人 工 智 能 中 ， 我 们 需要 从 已 知 的 事实 中 推导 出 新 的 事实 。 在 命题 逻辑 中 ， 这 样 的 过 程 
称 为 推演 。 给 定 两 个 假定 为 真 的 句子 ,我 们 能 推演 出 新 的 为 真 的 句子 ， 前 面 两 个 句子 称 为 前 
提 ， 推 注 出 的 句子 称 为 结论 ， 而 整个 称 为 论断 。 例 如 : 

前 提 1: 他 或 者 在 家 或 者 在 办 公 室 


前 提 2 : 他 不 在 家 
结论 所 以 ， 他 在 办 公 室 


如 果 我 们 用 互 代表 “他 在 家 "，O 代表 “他 在 办 公 室 "， 符 号 |- 代表 “所 以 ”， 那 上 面 的 
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论断 可 以 表示 成 : 

{H V 0, —H}I- 0 

问题 是 我 们 如 何 证 明 推 演 的 论断 是 合法 的 。 一 个 合法 的 论断 是 指 它 的 结论 是 前 提 的 必然 延 
续 。 换 言 之 ， 在 一 个 合法 的 推演 论断 中 ， 如 果 所 有 的 前 提 都 为 真 ， 而 结论 为 假 ， 这 是 不 可 能 的 。 

验证 论断 合法 性 的 一 种 方法 是 为 前 提 和 结论 建立 真 值 表 。 如 果 我 们 在 其 中 发 现 了 反例 ， 
那么 结论 就 是 非法 的 ， 反 例 就 像 : 所 有 的 前 提 都 为 真 ， 而 结论 却 是 假 。 

例 18.2 论断 {H V 0， 一 H}|-0 的 合法 性 可 以 用 如 下 的 真 值 表 证 明 : 


OK 





上 表 中 唯一 要 检查 的 行 是 第 二 行 ， 这 一 行 没 有 显示 反例 ， 因 此 ， 论 断 是 合法 的 。 有 些 论 
断 在 逻辑 上 是 非法 的 ， 例 如 : 


前 提 1 ; 如 果 她 富有 ， 她 有 车 
前 提 2 : 她 有 车 
结论 因此 ， 她 富有 


我 们 可 以 看 到 ， 即 使 前 两 个 句子 都 为 真 ， 结 论 却 是 假 。 我 们 把 上 面 的 论断 表示 成 : 
{R 一 C，C}|-R， 其 中 RR 代表 “她 富有 ”,，C 代表 “她 有 车 ”。 
例 18.3 论断 {RR 一 C，C}|-R 是 非法 的 ， 是 因为 能 找到 反例 。 





上 表 中 第 2 行 和 第 4 行 需要 检查 。 虽 然 第 4 行 没 问题 ， 但 第 2 行 显 示 了 反例 (两 个 真 的 
前 提 导 致 假 的 结论 )。 因 此 ， 这 个 论断 是 非法 的 。 

当 找 不 到 反例 时 ， 论 断 就 是 合法 的 。 

2. 谓词 逻辑 

在 命题 逻辑 中 ， 表 示 句 子 的 符号 是 原子 的 ， 我 们 不 能 分 割 开 它 而 发 现 各 个 组 成 部 分 中 所 
含 的 信息 。 例 如 ， 如 下 这 样 的 句子 : 

P1:“ 琳 达 是 玛丽 的 母亲 ” P:: “玛丽 是 安妮 的 母亲 ” 

我 们 可 以 用 很 多 方法 来 组 合 这 两 个 句子 ， 从 而 产生 其 他 的 句子 。 但 却 不 能 抽取 出 琳 达 和 
安妮 间 的 任何 关系 。 例 如 ， 我 们 不 能 从 上 面 两 个 句子 中 推导 出 琳 达 是 安妮 的 祖母 。 要 进行 这 
样 的 推导 ， 我 们 就 需要 谓词 逻辑 。 这 种 逻辑 定义 了 命题 各 部 分 间 的 关系 。- 
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在 谓词 逻辑 中 ， 和 句子 被 分 成 谓词 和 参数 。 例 如 ， 如 下 的 句子 被 写成 了 谓词 带 两 个 参数 的 
形式 : 

Pi:“ 琳 达 是 玛丽 的 母亲 ” 变 成 母亲 ( 琳 达 ， 玛丽) 

P2:“ 玛 丽 是 安妮 的 母亲 ” 变 成 母亲 (玛丽 ， 安 妮 ) 

上 面 句 子 中 的 母亲 关系 是 由 谓词 “母亲 ”来 定义 的 ， 如 果 在 两 个 句子 中 的 玛丽 是 指 同一 
个 人 ,我 们 可 以 推导 出 琳 达 和 安妮 间 的 新 的 关系 : 祖母 ( 琳 达 ， 安 妮 )。 这 就 是 谓词 逻辑 的 
全 部 意图 。 

(1) 句子 

谓词 逻辑 语言 中 的 句子 定义 如 下 : 

1 ) 一 个 带 有 nn 个 参数 的 谓词 ， 像 predicate_name(argumenti, …, argument;) 是 一 个 句子 ， 
predicate_name 把 各 个 参数 关联 起 来 。 每 个 参数 可 以 是 : 

a. 一 个 常数 ， 像 人 类 、 动 物 、 约 翰 、 玛 丽 。 

b. 一 个 变量 , 像 x、y 和 z。 

c. 一 个 函数 ， 像 母亲 (安妮)。 注 意 ， 函 数 是 谓词 ， 可 以 用 作 参 数 ， 函 数 的 返回 对 象 能 
替代 参数 。 

2 ) 两 个 常数 值 ( 真 和 假 ) 中 的 任 一 个 都 是 句子 。 

3 ) 如 果 了 是 句子 ， 则 一 P 也 是 句子 。 

4) 如 果 P 和 Q 是 句子 , 则 PV Q、P 人 人 Q、P 一 Q 和 PQ 都 是 句子 。 

例 18.4 

1 ) 句子 “John works for Ann’s sister” 可 以 被 写成 ， 


works [John,sister (Ann)] 


其 中 函数 sister(Ann) 用 作 参 数 。 
2 ) 句子 “John’s father loves Ann’s sister” 可 以 写成 : 


loves[father (John),sister (Ann)] 


(2 ) 量词 

谓词 逻辑 允许 使 用 量词 。 在 谓词 逻辑 中 两 个 常用 的 量词 是 V 和 3。 

1 ) 第 一 个 词 ,“V” 读 成 “所 有 的 ”， 被 称 为 全 称 量 词 ， 它 表明 变量 所 表示 的 全 部 对 象 某 
些 事 为 真 。 

2 ) 第 二 个 词 ,“3” 读 成 “存在 " ， 被 称 为 存在 量词 ， 它 表明 变量 所 表示 的 一 个 或 多 个 对 
象 某 些 事 为 真 。 

例 18.5 下 面 显示 英语 中 的 句子 如 何 被 写成 谓词 逻辑 中 的 句子 (x 是 占 位 符 ): 

1 ) 句子 “All men are mortals” 可 以 写成 : 

Vx[man (x) — mortal (x)] 
2 ) 句子 “Frogs are green ”可 以 写成 : 
Vx[frog(x) — green (x)] 

因为 句子 可 以 写成 “All frogs are green” 或 “Any frog are green”。 所 以 谓词 “ green- 
ness ”可 以 应 用 于 所 有 的 frog (青蛙 ) 上 。 

3 ) 句子 “Some flowers are red ”可 以 写成 : 


jx[flower (x) 人 red(x) ] 
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注意 括号 中 的 运算 符 “ 和 ”代替 了 “一 ”， 这 样 做 的 原因 超出 了 本 书 的 范围 。 
4 ) 句子 “John has a book” 可 以 写成 : 
IJx[book(x) A has (John, x)] 


换言之 ,句子 变 成 了 “There exist a book that belongs to John”。 
5 ) 句子 “No frog is yellow” 可 以 写成 : 
Vxl[frog (XxX) 一 全 Yellow(x) ] 或 一 习 x[frog (x) 人 yellow (x)] 


意思 是 : 不 存在 一 只 青蛙 且 是 黄色 的 。 

(3) 推演 

在 谓词 逻辑 中 ， 如 果 没 有 量词 ， 一 个 论断 的 真 假 确认 与 命题 逻辑 完全 相同 。 但 是 ， 当 有 
量词 时 ,判断 就 变 得 复杂 多 了 。 例 如 ， 下 面 的 论断 是 完全 合法 的 。 

前 提 1: All men are mortals 


前 提 2: Socrates is a man 
结论 Therefore, Socrates is mortal 


判断 这 个 简单 的 论断 并 不 复杂 。 我 们 可 以 写成 : 


vy x[man (x) — mortal (x) ] ,man (Socrates) |- mortal (Socrates) 


既然 第 一 个 前 提 是 讨论 所 有 的 人 ， 我 们 可 以 把 这 个 类 中 的 一 个 实例 (Socrates) 放 到 前 
提 中 ， 就 得 到 如 下 的 论断 : 

man (Socrates) 一 mortal (Socrates) ,man(Socrates) |- mortal (Socrates) 

这 可 简化 成 Mi 一 Mz，Mi |- M;。 这 里 Mi 是 man(Socrates)，M; 是 mortal(Socrates)。 这 
个 结果 是 命题 逻辑 中 的 一 个 论断 ， 显 然 是 合法 的 。 但 是 ， 在 谓词 逻辑 中 有 许多 论断 不 像 这 样 
容易 判别 ， 我 们 需要 一 套 系统 的 证 明 ， 但 这 超出 了 本 书 的 范围 。 

3. 超 谓 词 逻 辑 

由 于 逻辑 推理 的 需要 ， 逻 辑 得 到 了 进一步 的 发 展 ， 这 些 包 括 高 阶 逻 辑 、 软 认 逻 辑 、 模 态 
逻辑 和 时 态 逻 辑 。 这 里 只 是 简单 地 罗列 一 下 这 些 名 词 。 对 它们 的 讨论 超出 了 本 书 的 范围 。 

(1) 高 阶 逻辑 

高 阶 逻 辑 扩展 了 谓词 逻辑 中 量词 VY 和 3 的 范围 。 这 些 谓词 逻辑 中 的 量词 把 变量 x 和 y 绑 
定 到 实例 (在 初始 化 时 )。 在 高 阶 逻辑 中 我 们 能 使 用 量词 捆绑 那些 代表 属性 和 关系 的 变量 。 
这 样 ， 在 初始 化 的 过 程 中 ， 这 些 变量 就 被 换 成 了 谓词 。 例 如 ， 我 们 可 以 有 : V P(P; A P，)， 
下 标 j 和 a 表 示 John 和 Anne， 这 意味 着 John 和 Anne 具有 完全 相同 的 属性 。 

(2 ) 模 态 逻辑 

逻辑 的 一 个 快速 发 展 的 趋势 是 模 态 逻辑 。 逻 辑 中 包含 了 “could”“should”、“may”、 
“might”“ought” 等 这 样 的 表达 式 ， 来 表达 句子 中 语法 上 的 语气 。 在 这 样 的 逻辑 中 ， 我 们 
有 符号 表示 “it is possible that” 这 样 的 运算 符 。 

. (3 ) 时 态 逻 辑 

时 态 逻 辑 像 模 态 逻辑 一 样 ， 用 一 套 时 态 运算 符 扩 展 了 谓词 逻辑 ， 如 。 from now on” 或 
者 “at some point in time”， 它 们 包含 了 论断 合法 性 中 的 时 间 因 素 。 

(4 ) 默认 逻辑 

在 默认 逻辑 中 ， 我 们 假定 论断 的 默认 结论 可 以 被 接收 ， 只 要 论断 与 知识 库 中 的 内 容 相 一 
致 即 可 。 例如， 我 们 假定 所 有 的 鸟 都 会 飞 ， 除 非 知 识 库 中 有 内 容 废除 了 这 条 通用 的 事实 。 
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18.2.4 ”基于 规则 的 系统 


基于 规则 的 系统 使 用 一 组 规则 来 表示 知识 ， 这 些 规 则 能 用 来 从 已 知 的 事实 中 推导 出 新 的 
事实 。 规 则 表示 当 指 定 条 件 满足 时 什么 为 真 。 基 于 规则 的 数据 库 是 一 组 if…then… 语 句 ， 它 
们 的 形式 为 : 

if A then B 或 R 一 B 

其 中 A 称 为 前 提 ，B 为 结论 。 注 意 在 基于 规则 的 系统 中 ， 每 条 规则 都 是 独立 处 理 的 ， 与 
其 他 规则 没有 关联 。 

1. 组 成 

一 个 基于 规则 的 系统 由 三 部 分 构成 : 解释 器 (或 
推理 机 )、 知 识 库 和 事实 库 ， 如 图 18-4 所 示 。 

(1 ) 知识 库 A ( 失 妥 外 

基于 规则 系统 中 的 知识 库 部 分 就 是 规则 的 数据 
库 (仓库 )。 它 包含 一 组 预先 建立 的 规则 ， 这 些 规则 图 164 基于 规划 的 系统 组 成 
能 从 给 定 事实 中 得 出 结论 。 

(2 ) 事实 库 

事实 库 中 包含 了 知识 库 中 的 规则 要 使 用 的 一 组 条 件 。 

(3 ) 解释 器 

解释 器 (推理 机 ) 是 一 个 处 理 器 或 控制 器 (如 一 段 程序 )， 它 把 规则 和 事实 组 合 在 一 起 。 
解释 器 有 两 种 类 型 : 正 向 推理 和 反 向 推理 。 我 们 将 简单 描述 它们 。 

2. 正 向 推理 

正 向 推理 是 这 样 一 个 过 程 ， 解 释 器 使 
用 一 组 规则 和 一 组 事实 来 执行 一 个 行动 。 
这 个 行动 可 能 是 向 事实 库 中 增加 一 条 新 的 
事实 ,或 处 理 其 他 一 些 命令 ， 如 开启 另 一 
个 程序 或 机 器 。 解 释 器 解释 和 执行 规则 ， 
直到 不 再 有 要 解释 的 规则 。 图 18-5 显示 了 
基本 的 算法 。 

如 果 系 统 中 有 任何 冲突 发 生 ， 冲 突 是 
指 有 两 条 不 同 的 规则 可 以 应 用 到 一 个 事实 
上 , 或 一 条 规则 可 以 应 用 到 两 个 事实 上 ， 
这 时 系统 就 要 调用 冲突 处 理 过 程 来 解决 这 
个 问题 。 这 就 保证 了 只 有 一 个 输出 能 被 加 


执行 传递 冲突 处 理 

策略 的 第 一 条 规则 
执行 由 应 用 规则 

到 事实 库 中 或 一 个 行动 被 采取 。 关 于 冲突 导出 的 行动 

处 理 的 讨论 比较 复杂 ， 超 出 了 本 书 的 范围 。 


3. 反 向 推理 图 18-5 正 向 推理 的 流程 图 
如 果 系 统 是 证 明 一 个 结论 ， 那 么 正 向 


推理 效率 不 高 。 面 对 给 出 的 结论 ， 所 有 的 规则 检查 所 有 的 事实 。 这 种 情况 下 ， 如 果 使 用 反 向 
推理 ， 效 率 会 高 些 。 图 18-6 显示 了 反 向 推理 的 过 程 。 
过 程 从 一 个 结论 (目标) 开始， 如果 目标 已 在 事实 库 中 ， 则 过 程 停止 结论 得 到 验证 。 









找到 所 有 满足 ”和 “| 
条 件 的 规则 
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如 果 结 论 不 在 事实 库 中 ,那么 系统 查找 目标 在 规则 结论 中 的 规则 。 但 是 ， 反 向 推理 不 是 触发 
这 条 规则 ， 而 是 去 验证 这 条 规则 中 的 每 个 事 
实 (递归 )。 如 果 这 条 规则 中 的 所 有 事实 都 在 
事实 库 中 ， 那 么 原来 的 目标 就 得 到 验证 。 


18.3 ”专家 系统 


专家 系统 使 用 前 面 所 讨论 的 知识 表示 语 
， 来 执行 通常 需要 人 类 专家 才能 完成 的 任 
务 。 它 们 被 用 在 需要 人 类 专家 ， 而 人 类 专家 
却 缺 少 、 昂 贵 或 不 可 用 等 场合 。 例 如 ， 在 医 


“1: 目标 在 事实 库 中 
2: 目标 不 在 事实 库 中 
疗 领域 ， 可 建立 专家 系统 从 一 组 症状 中 得 到 


试图 证 明 这 条 规则 
中 的 每 个 事实 
可 能 病因 的 子 集 ， 而 这 项 任务 通常 是 由 医生 


来 进行 的 。 图 18-6 反 向 推理 流程 图 


18.3.1 抽取 知识 


一 个 专家 系统 是 建立 在 预先 定义 的 关于 领域 专家 经 验 的 知识 的 基础 上 的 。 例 如 ， 医 疗 专 
家 系统 是 建立 在 有 经 验 的 医生 所 具有 的 知识 的 基础 上 的 ， 而 这 些 有 经 验 的 医生 是 专攻 这 些 领 
域 的 专家 。 因 此 ， 建 立 专家 系统 的 第 一 步 就 是 从 人 类 专家 身上 抽取 知识 。 抽 取 的 知识 就 变 成 
了 我 们 前 面 讲 到 的 知识 库 。 

知识 工程 

从 专家 身上 抽取 知识 通常 是 困难 的 ， 这 有 几 个 原因 : 

1 ) 专家 拥有 的 知识 通常 是 启发 式 的， 它们 是 基于 概率 的 ， 而 不 是 确定 的 。 

2 ) 专家 常常 发 现 用 可 以 存放 在 知识 库 中 的 规则 形式 来 描述 知识 是 艰难 的 。 例 如 ， 要 一 
步 一 步 地 显示 故障 电动 机 是 如 何 被 诊断 的 ， 这 对 电气 工程 师 来 说 是 非常 艰难 的 。 知 识 常常 是 
直觉 的 。 

3 ) 知识 获取 只 能 通过 与 专家 个 人 会 面 才能 进行 。 如 果 会 面 者 对 这 种 会 面 并 不 擅长 ， 那 
么 会 面 将 是 累 人 的 和 枯燥 的 。 

知识 抽取 过 程 通常 是 由 知识 工程 师 来 完成 。 他 可 能 并 不 是 此 领域 的 专家 ， 但 他 有 经 验 ， 
知道 如 何 去 会 面 ， 如 何 去 解 释 答案 ， 所 有 这 些 工程 师 能 用 来 建立 知识 库 。 


18.3.2 ”抽取 事实 


为 了 能 推导 新 的 事实 或 采取 动作 ， 除 了 需要 用 知识 表示 语言 表示 的 知识 库 外 ， 还 需要 事 
实 库 。 专 家 系统 中 的 事实 库 是 基于 事例 的 ， 在 事例 中 事实 被 收集 或 度量 ， 然 后 进入 系统 ， 被 
推理 机 使 用 。 


18.3.3 ”体系 结构 


图 18-7 显示 了 一 个 专家 系统 体系 结构 背后 的 通常 理念 。 如 图 所 示 ， 一 个 专家 系统 有 7 
个 部 分 构成 : 用 户 、 用 户 界面 、 推 理 机 、 知 识 库 、 事 实 库 、 解 释 系统 和 知识 库 编 辑 器 。 

推理 机 是 专家 系统 的 心脏 ， 它 与 知识 库 、 事 实 库 和 用 户 界面 进行 通信 。 专 家 系统 中 7 个 
部 分 中 的 4 个 (用户 界面 、 推 理 机 、 解 释 系 统 和 知识 库 编 辑 器 ) 是 能 一 次 建造 ， 为 多 个 应 用 






找 一 条 目标 是 
结论 的 规则 


zl 
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使 用 的 ， 因 为 它们 并 不 依赖 于 特殊 的 知识 库 或 事实 库 。 图 中 这 些 部 分 显示 在 一 个 有 阴影 的 方 
框 中 ,通常 它们 被 称 为 专家 系统 外 上 克 。 
蝎 用 户 





知识 库 事实 库 


图 18-7 专家 系统 体系 结构 
1. 用 户 
用 户 是 使 用 系统 ， 从 所 提供 的 专家 经 验 中 获 益 的 实体 。 
2. 用 户 界 面 


用 户 界 面 允 许 用 户 与 系统 交互 ， 用 户 界面 能 接收 用 户 的 自然 语言 ， 然 后 把 它们 翻译 给 系 
统 。 大 多 数 用 户 界 面 提 供用 户 友好 的 菜单 系统 。 

3. 推理 机 

推理 机 是 专家 系统 的 心脏 ， 它 使 用 知识 库 和 事实 库 推导 出 要 采取 的 动作 。 

4. 知识 库 

知识 库 是 基于 与 相关 领域 专家 的 会 面 而 得 到 的 知识 的 集合 。 

5. 事实 库 

事实 库 在 专家 系统 中 是 基于 事例 的 。 对 于 每 个 事例 ， 用 户 输入 可 用 的 或 度量 的 数据 进入 
事实 库 ， 推 理 机 为 这 特殊 的 事例 使 用 这 些 数据 。 

6. 解释 系统 

并 不 是 所 有 的 专家 系统 都 有 解释 系统 ， 它 用 来 解释 推理 机 得 出 的 结论 的 合理 性 。 

7. 知识 编辑 器 

并 不 是 所 有 的 专家 系统 都 有 知识 编辑 器 ， 当 从 领域 专家 那里 获得 新 的 经 验 时 ， 用 知识 库 
编辑 器 来 更 新 知识 库 。 


18.4 感知 


人 工 智能 的 一 个 目标 是 创建 一 台 行 为 像 专家 的 机 器 一 一 专家 系统 。 另 外 一 个 目标 是 创建 
一 台 行 为 像 普通 人 的 机 器 。“ 感 知 ” 这 个 词 的 一 个 意思 是 理解 通过 感官 (视觉 、 听 觉 、 触 觉 、 
嗅觉 、 味 觉 ) 接收 到 了 什么 。 人 类 通过 眼睛 看 风景 ， 头 脑 把 它 解释 成 在 风景 中 抽取 出 来 的 对 
象 类 型 。 人 类 通过 耳 采 听 到 一 组 声音 信号 ， 头 脑 把 它 解释 成 有 意思 的 句子 ， 等 等 。 

如 果 一 个 智能 体 要 表现 得 像 人 类 ， 那 它 就 应 该 有 感知 能 力 。 人 工 智能 已 经 初步 完成 两 
种 感知 : 视觉 和 听觉 。 虽 然 其 他 的 感知 可 能 在 未 来 会 被 实现 ， 但 本 节 将 简要 讨论 这 两 个 领 
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域 的 研究 。 
18.4.1 图 像 处 理 


图 像 处 理 或 计算 机 视觉 是 人 工 智能 的 一 个 研究 领域 ， 它 处 理 通过 像 摄像 机 这 样 的 智能 体 
的 人 工 眼睛 而 获得 的 对 对 象 的 感知 。 一 个 图 像 处 理 器 从 外 部 世界 获得 二 维 图 像 ， 然 后 创建 在 
场景 中 的 这 个 对 象 的 三 维 描述 。 虽 然 ， 这 对 人 类 来 说 是 容易 的 事情 ， 但 对 智能 体 来 说 却 是 困 
难 的 事情 。 图 像 处 理 器 的 输入 是 一 幅 或 多 幅 场景 图 像 ， 而 得 到 的 输出 是 场景 中 对 象 的 描述 。 
处 理 器 使 用 了 一 个 含有 对 象 比较 特性 的 数据 库 (图 18-8 ) 。 

我 们 需要 强调 的 是 ， 图 像 的 获取 是 通过 使 用 摄影 和 电视 技术 来 创建 图 像 的 。 人 工 智 能 关 
心 的 是 如 何 解释 这 些 图 像 ， 并 从 中 抽取 出 对 象 的 特征 。 

1. 边缘 探测 

图 像 处理 的 第 一 步 是 边缘 探测 ， 去 查找 图 像 中 的 边缘 在 哪里 。 边 缘 定义 了 图 像 中 的 对 象 
和 背景 间 的 边界 。 假 定 没有 伪装 存在 时 ， 通 常 属于 对 象 的 表面 和 环境 间 是 存在 着 明显 的 反差 
的 。 边 缘 显 示 了 在 表面 、 深 度 或 亮度 方面 的 连续 性 。 例 如 ， 图 18-9 显示 了 一 个 非常 简单 的 
图 像 和 用 0 ~ 9 表示 的 像素 点 的 亮度 值 。 这 里 0 表示 黑 ，9 表示 白 。 使 用 亮度 较 大 的 差异 值 
去 查找 邻接 像素 点 ， 就 能 找到 边缘 。 


二 维 图 像 


图 像 处 理 器 





对 象 的 三 维特 征 图 像 
图 18-8 ”图 像 处 理 器 的 组 成 部 分 图 18-9 边缘 探测 处 理 


这 里 有 几 种 数学 方法 ， 利 用 像素 点 的 亮度 值 从 背景 中 找到 对 象 的 边界 。 最 简单 的 一 种 方 
法 是 分 异 亮度 矩阵 。 具 有 一 致 亮度 值 的 区 域 将 产生 比较 低 的 分 异 值 (0 或 1 )， 而 边缘 将 产生 
最 大 的 分 异 值 。 关 于 这 些 方 法 的 讨论 超出 了 本 书 的 范围 。 我 们 推荐 本 章 最 后 所 列 的 参考 书 ， 
以 便 进一步 的 研究 。 

2. 分 段 

分 段 是 图 像 分 析 接 下 来 的 一 步 。 分 段 把 图 像 分 成 同 构 的 段 或 区 域 。 同 构 的 定义 随 着 方法 
的 不 同 而 不 同 。 但 是 ， 通 常 同 构 的 区 域 是 其 中 像素 点 亮度 值 变 化 平滑 的 区 域 。 分 段 与 边缘 探 
测 非常 类 似 。 在 边缘 探测 中 ， 对 象 的 边缘 和 背景 被 找到 。 在 分 段 中 ， 对 象 中 两 个 不 同 区 域 的 
边界 被 找到 。 经 过 分 段 后 ， 对 象 被 分 成 不 同 的 区 域 。 

有 几 种 方法 进行 分 段 。 有 一 种 称 为 “ 阅 值 化 ”， 它 把 指定 亮度 值 的 像素 点 选择 出 来 ， 试 
图 去 发 现 所 有 具有 相同 或 非常 相近 亮度 值 的 像素 点 。 通 过 这 种 方法 找到 的 像素 点 形成 了 一 个 
段 。 另 外 一 种 方法 称 为 分 割 ， 分 割 选取 一 个 非 同 构 的 区 域 ， 把 它 分 成 同 构 的 区 域 。 还 有 一 种 
方法 称 为 合并 ， 它 用 来 进行 具有 相同 亮度 值 区 域 的 合并 。 

3. 查找 深度 

图 像 分 析 接 下 来 的 一 步 是 查找 对 象 的 深度 或 是 图 像 中 的 对 象 。 深 度 的 查找 可 以 帮助 智能 
体 去 测量 对 象 距 它 多 远 。 有 两 种 常用 的 方法 : 立体 视觉 和 运动 。 
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( 1) 立体 视觉 

立体 视觉 (有 时 称 为 立体 影像 ) 使 用 人 类 眼睛 的 技术 来 发 现 对 象 的 深度 。 为 了 得 到 准确 
的 距离 识别 ， 人 类 要 使 用 两 只 眼睛 。 如 果 对 象 靠 得 非 常 近 ， 我 们 眼睛 里 创建 的 两 幅 图 像 是 不 
同 的 ; 但 如 果 对 象 很 远 ， 则 这 两 幅 图 像 几 乎 是 相同 的 。 无 需 经 过 数学 的 计算 和 证 明 ， 我 们 就 
可 以 说 识别 对 象 距 离 的 一 种 工具 就 是 两 只 眼睛 或 两 台 摄 像 机 。 两 台 摄 像 机 创建 的 图 像 能 帮助 
智能 体 去 判定 对 象 是 近 还 是 远 。 

(2 ) 运动 

另外 一 种 对 发 现 图 像 中 的 对 象 距离 有 帮助 的 方法 是 : 当 图 中 一 个 或 多 个 对 象 移动 时 建立 
多 幅 图 像 。 在 场景 中 移动 对 象 与 其 他 对 象 间 的 相对 位 置 能 给 出 对 象 距 离 的 提示 。 例 如 ， 假 定 
一 段 视频 显示 了 一 个 人 在 房子 前 的 移动 。 人 和 房子 ( 近 距 离 对 象 ) 的 相对 位 置 会 改变 , 但 人 
和 远 处 的 山 间 的 相对 位 置 却 不 会 变 。 智 能 体 就 能 得 出 结论 : 房子 在 近 处 ， 而 山 在 远 处 。 

4. 查找 方向 

场景 中 的 对 象 的 方向 可 以 使 用 两 种 技术 来 发 现 : 光照 和 纹理 。 

(1) 光照 


光 从 物体 表面 反射 的 总 量 由 多 个 因素 来 决定 。 如 何 一 
个 对 象 的 不 同 表面 的 光学 特性 是 相同 的 ， 那 么 反射 光线 的 
总 量 将 取决 于 反射 光源 的 物体 表面 ( 它 的 相对 位 置 ) 的 方 


向 。 图 18-10 显示 了 两 个 被 画 出 的 对 象 。 有 阴影 的 对 象 毫 
无 疑问 更 准确 地 显示 了 对 象 表面 的 方向 。 

(2 ) 纹理 

纹理 (有 规律 重复 的 图 案 ) 也 能 对 查找 方向 或 表面 的 曲率 有 所 帮助 。 如 果 智 能 体能 识别 
图 案 ， 这 将 帮助 它 查 找 对 象 的 方向 或 曲率 。 

5. 对 象 识 别 

图 像 处理 的 最 后 一 步 是 对 象 识 别 。 要 识别 对 象 ， 智 能 体 需 要 在 它 的 记忆 里 有 可 进行 比较 
的 对 象 模型 。 但 是 ， 把 所 见 的 每 个 对 象 模 型 都 进行 创建 和 存储 是 一 个 不 可 能 的 任务 。 一 个 解 
决 方案 是 假定 要 识别 的 对 象 是 一 个 复合 的 对 象 ， 它 由 一 组 简单 的 几何 形状 体 组 成 。 这 些 原始 
的 形状 能 在 智能 体 的 记忆 中 创建 并 存储 。 我 们 需要 智能 体 识 别 的 对 象 类 型 能 用 这 些 对 象 的 组 
合 创建 出 来 并 保存 起 来 。 

当 智 能 体 “ 看 ”到 对 象 ， 它 就 进行 对 象 的 分 解 ， 把 对 象 分 解 成 原始 形状 的 组 合 。 如 果 
组 合 的 对 象 对 智能 体 来 说 是 已 知 的 ， 那 对 象 就 被 识别 了 。 图 18-11 显示 了 一 小 部 分 原始 几何 


图 18-10 ”光照 在 方向 查找 中 的 效果 





形状 。 
圆柱 体 圆锥 截 圆锥 体 棱锥 体 截 棱锥 体 
Wa 原始 几何 形状 
6. 应 用 


图 像 处 理 的 一 个 应 用 领域 是 制造 业 ， 特 别 是 在 组 装 生 产 线 上 。 一 个 具有 图 像 处 理 能 力 的 
机 器 人 能 用 来 测定 组 装 生 产 线 上 的 对 象 的 位 置 。 在 这 样 的 环境 下 ， 需 要 感知 的 对 象 数目 是 有 
限 的 ， 所以， 图像 处 理 就 变 得 非常 有 帮助 。 
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18.4.2 ”语言 理解 


人 类 一 个 固有 的 能 力 是 能 理解 ( 即 解释 ) 所 感知 的 声音 信和 号。 一 台 能 理解 自然 语言 的 机 
器 在 日 常生 活 中 是 非常 有 用 的 。 例 如 ， 它 能 替代 电话 操作 员 (在 大 部 分 时 间 里 )。 它 还 可 以 
用 在 系统 需要 预先 定义 格式 查询 的 场合 。 例 如 ， 送 到 数据 库 的 查询 必须 遵循 指定 系统 所 用 的 
格式 。 能 够 理解 自然 语言 中 的 查询 ， 然 后 把 它们 翻译 成 指定 格式 的 机 器 是 非常 有 用 的 。 

机 器 理解 自然 语言 的 任务 分 成 4 个 连续 的 步 又: 语音 识别 、 语 法 分 析 、 语 义 分 析 和 语 用 
分 析 。 

1. 语音 识别 

自然 语言 处 理 的 第 一 步 是 语音 识别 。 在 这 一 步 中 ， 语 音信 号 被 分 析 ， 其 中 所 含 的 单词 序 
列 被 抽取 出 来 。 语 音 识 别 子 系统 的 输入 是 连续 (模拟 ) 的 信号 ， 输 出 是 单词 的 序列 。 信 和 号 需 
要 被 分 割 成 不 同 的 声音 ， 有 时 称 为 “音素 ”， 而 声音 还 需要 组 合 到 单词 中 。 但 是 ， 这 些 详细 
的 过 程 超出 了 本 书 的 范围 。 我 们 把 这 些 问 题 留 给 专门 介绍 语音 识别 的 书 。 

2. 语法 分 析 

语法 分 析 这 一 步 用 来 定义 单词 在 句子 中 是 如 何 组 织 的 ， 这 对 于 像 英 语 这 样 的 语言 是 非常 
困难 的 任务 。 因 为 单词 在 句子 的 作用 并 不 是 由 它 在 句 中 的 位 置 决定 的 。 例 如 ， 下 面 两 个 句子 : 


Mary rewarded John . 
John was rewarded by Mary . 


这 两 个 句子 中 John 都 是 受到 奖励 的 ， 但 在 第 一 个 句子 中 ，John 在 最 后 的 位 置 ， 而 Mary 
在 第 一 个 位 置 。 一 台 机 器 在 听 到 上 面 任 一 个 句子 时 都 要 能 正确 地 解释 ， 得 到 相同 的 结论 。 

(1) 文法 

正确 分 析 句 子 的 第 一 工具 是 良好 定义 的 文法 。 一 种 像 英语 这 样 的 完全 成 熟 的 语言 具有 非 
常 大 的 文法 规则 集合 。 我 们 假定 一 个 非常 小 的 英语 子 集 ， 定 义 非 常 小 的 规则 集合 来 说 明 观 点 。 

语言 的 文法 定义 可 以 使 用 多 种 方法 : 我 们 使 用 BNF (Backus-Nanur 范式 ) 的 一 个 简单 的 
版 本 。Backus-Naur 范式 被 用 在 计算 机 科学 中 ， 定 义 编程 语言 的 语法 ( 表 18-1 )。 


表 18-1 一 个 简单 文法 


序 号 规 则 
1 句子 一 名 词 短语 ”动词 短语 
2 名 词 短语 = 名 词 | 冠 词 名 词 | 冠 词 形容 词 名 词 
3 动词 短语 二 动词 | 动词 ”名词 短语 | 动词” 名词 短语 副词 
4 名 词 = [home]l[cat]|[water]l[dog]|[John]I[Mary] 
5 冠 词 [ajl[the] 
6 形容 词 一 [big]I[small]l[tall]I[short]l[white]I[black] 
7 动词 下 [goes]l[comes]l[eats]I[drinks]l[has]/[loves] 


第 一 条 规则 定义 了 一 个 句子 是 一 个 名 词 短 语 跟着 一 个 动词 短语 ， 第 二 条 规则 定义 了 名 
词 短语 有 三 个 选择 : 单个 名 词 、 一 个 冠 词 跟 一 个 名 词 ， 或 者 一 个 冠 词 跟 一 个 形容 词 再 跟 一 个 
名 词 。 第 四 条 规则 明确 地 定义 了 什么 是 一 个 名 词 。 在 我 们 这 个 简单 的 语言 里 只 定义 了 7 个 名 
词 ， 而 在 像 英语 这 样 的 语言 里 名 词 表 是 在 词典 中 定义 的 。 第 六 条 规则 定义 了 形容 词 一 个 非常 
小 的 集合 。 第 七 条 规则 定义 了 动词 一 个 非常 小 的 集合 。 
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虽然 我 们 的 语言 的 语法 非常 原始 ， 但 我 们 能 从 中 产生 许多 句子 ， 例 如 ， 我 们 有 : 


John comes home. 

Mary drinks water. 
John has a white dog. 
John loves Mary. 

Mary loves John. 


(2 ) 词法 分 析 器 
表 18-1 中 定义 了 简单 文法 ， 即 使 使 用 不 同 的 选项 ， 它 也 将 是 非常 清楚 的 。 一 台 判 定 一 
个 句子 是 否 符合 文法 (语法 ) 的 机 器 在 判定 一 个 句子 是 否 合法 之 前 ， 并 不 需要 检查 所 有 
可 能 的 选项 。 这 个 任务 是 由 词法 分 析 器 句子 
来 完成 的 。 词 法 分 析 器 基于 文法 规则 建立 
一 棵 词法 分 析 树 来 判断 一 个 句子 的 合法 性 。 名 辣 短 庄 et 
图 18-12 显 示 了 句子 “John has a white . 动 现 名 说 短 语 
dog” 对 应 的 词法 分 析 树 ， 该 句子 是 基于 
表 18-1 中 定义 的 规则 产生 的 。 
3. 语义 分 析 John 
语义 分 析 就 是 在 句子 被 语法 分 析 之 后 
抽取 出 句子 的 意思 。 这 种 分 析 建 立 了 句子 
中 所 涉及 的 对 象 的 表示 方法 、 它 们 的 关系 以 及 它们 的 属性 。 分 析 能 用 我 们 前 面 所 讨论 的 任 一 
种 知识 表示 模式 。 例 如 ,句子 “John has a dog” 可 以 用 谓词 逻辑 表示 成 : 


jx dog (x) has (John, x) 


4. 语 用 分 析 

前 面 的 三 个 步骤 (语音 识别 、 语 法 分 析 和 语义 分 析 ) 能 创建 口语 句子 的 知识 表示 。 在 大 
多 数 情况 下 ， 另 外 一 步 ， 语 用 分 析 是 用 来 进一步 明确 句子 的 意图 和 消除 歧义 。 

(1) 意图 

句子 的 意图 是 不 能 通过 上 面 的 三 个 步骤 发 现 的 。 例 如 ， 句 子 “ Can you swim a mile?” 问 
的 是 听 者 的 能 力 ， 而 句子 “ Can you pass the salt?” 却 只 是 一 句 礼 貌 的 请 求 。 英 语句 子 有 许 
多 种 不 同 的 意图 ， 如 告诉 、 请 求 、 答 应 、 询 问 等 。 语 用 分 析 就 是 用 来 发 现 句 子 的 这 些 意图 的 。 

(2 ) 消除 歧义 

有 时 句子 在 语义 分 析 之 后 是 有 歧义 的 。 歧 义 的 出 现 有 不 同 的 情况 。 一 个 单词 有 多 于 一 种 
的 功能 ， 如 单词 “hard” 既 能 作 形 容 词 又 能 作 副词 。 一 个 单词 有 多 于 一 种 的 意思 ， 如 单词 
“ball” 在 “football” 和 “ball room” 中 是 不 同 的 含义 。 两 个 单词 有 着 相同 的 发 音 ， 却 有 着 
不 同 的 拼写 和 含义 。 一 个 句子 在 语法 上 可 能 是 正确 的 ， 但 在 含义 上 却 是 没有 道理 的 。 例 如 ， 
句子 “ John ate the mountain ”语法 分 析 时 是 合法 的 ， 语义 分 析 时 也 是 正确 的 ， 但 含义 却 是 
毫 无 道理 的 。 语 用 分 析 的 另外 一 个 目的 : 如 果 可 能 的 话 ， 从 句子 的 知识 表示 中 消除 歧义 。 


18.5 “搜索 


人 工 智能 解决 问题 的 一 种 技术 是 搜索 ， 这 一 节 我 们 将 简单 地 讨论 这 种 技术 。 搜 索 可 以 描 
述 成 用 状态 (情形 ) 集合 求解 问题 。 搜 索 过 程 开始 于 一 个 起 始 状态 ， 经 过 中 间 状 态 ， 最 后 到 
达 目 标 状态 。 例 如 ， 在 难题 求解 中 ， 初 始 状态 就 是 未 解决 的 难题 ， 中 间 状 态 就 是 对 难题 采取 








has a white dog 


图 18-12 分 析 一 个 句子 
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的 每 一 个 步 又， 目标 状态 就 是 难题 被 解决 时 的 情形 。 搜 索 过 程 所 使 用 的 全 部 状态 的 集合 称 为 
搜索 空间 。 

图 18-13 显示 了 一 个 具有 5 个 状态 的 状态 空间 的 例子 。 其 中 任 一 个 状态 都 可 能 是 初始 状 
态 或 目标 状态 。 带 箭头 的 线 显示 了 采取 合适 
的 动作 后 ， 一 个 状态 是 如 何 从 一 个 状态 走 到 
另 一 个 状态 的 。 注 意 : 如 果 没 有 动作 或 动作 
系列 可 被 采取 ， 那 么 从 一 个 状态 到 另 一 个 状 
态 的 转化 也 许 就 是 不 可 能 的 。 

例 18.6 一 个 显示 搜索 空间 的 难题 的 示 
例 是 著名 的 8 数字 游戏 ， 难 题 是 一 个 具有 9 
个 方块 格子 的 盘子 。 盘 子 中 只 有 8 个 方块 ， 
这 就 意味 着 总 有 一 个 格子 是 空 的 。 方 块 被 打上 1 到 8 的 数字 。 给 定 这 些 方块 一 个 初始 随机 的 
安排 (初始 状态 )， 目 标 就 是 重新 安排 这 些 
方块 ， 直 至 实现 方块 的 有 序 排列 (目标 状 下 解决 的 迷宫 
态 )。 游 戏 的 规则 是 一 个 方块 能 滑 入 空 的 方 
格 。 图 18-14 显示 了 初始 和 目标 状态 的 一 
个 实例 。 


搜索 方法 


有 两 种 常用 的 搜索 方法 : 变 力 搜索 和 启 
发 式 搜 索 。 蛮 力 搜索 本 身 又 有 广度 优先 和 深度 优先 。 

1. 蛮 力 搜索 

当 对 搜索 没有 任何 先 验 的 知识 时 ， 我 们 就 使 用 蛮 力 搜索 。 例 如 ， 在 图 18-15 中 ，A 和 T 
分 别 代表 起 点 和 终点 ， 我 们 要 在 迷宫 中 找到 从 A 到 工 的 路 。 迷 官 的 树 形 图 如 图 18-16 所 示 。 





图 18-13 一 个 搜索 空间 的 例子 





图 18-14 例 18-6 的 初始 状态 和 可 能 的 状态 
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图 18-15 显示 蛮 力 搜索 的 一 个 迷 官 图 18-16 图 18-15 的 迷宫 对 应 的 树 


(1) 广度 优先 搜索 
在 这 种 方法 中 ,我 们 从 树 的 根 开始 ， 在 我 们 走向 下 一 层 前 ,检查 当前 层 中 的 所 有 节点 。 
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图 18-17 显示 了 迷 富 的 从 左 到 右 的 广度 优先 搜索 。 注 意 : 在 到 达 目 标 状态 前 ， 我 们 不 得 不 搜 
索 所 有 的 节点 ， 所 以 这 种 方法 是 低 效 的 。 如 果 我 们 的 搜索 是 从 右 到 左 的 ， 那 么 我 们 要 搜索 的 
节点 数 可 能 就 不 同 了 。 

(2 ) 深度 优先 搜索 

在 这 种 方法 中 ， 我 们 从 树 的 根 开始 ， 做 一 个 向 前 搜索 ， 直 至 发 现 目标 或 到 达 一 个 死 端 。 
如 果 到 达 了 死 端 ， 我 们 回溯 到 最 近 的 分 支 ， 然 后 再 次 向 前 搜索 。 我 们 继续 这 样 的 过 程 ， 直 至 
达到 目标 ( 见 图 18-18 )。 


1 层 _--*@ B C 
上 ne at BSN 由 
og i NN 人 四 
ee I P 
4 层 Be < 和 us 
pf me K ™ 
5 层 证 六 = 4- 长- SN 
用 全 LS 
6 层 -R-------N--eQ--G-= N RQ 
HK /N\ 
7 层 8- -~ 国 S ©@ 
图 18-17 图 18-16 的 广度 优先 搜索 图 18-18 图 18-16 的 深度 优先 搜索 


图 18-18 显示 了 对 应 图 18-15 中 的 迷宫 从 右 开 始 的 深度 优先 搜索 。 搜 索 路 径 ACFP 到 达 
了 一 个 死 端 ， 所 以 我 们 回溯 到 A 点 ， 继 续 沿 着 路 径 ABDG. 搜 索 ， 到 达 了 一 个 死 端 ， 回 溯 到 
B 点 ， 沿 着 路 径 BEIMO 搜索 ， 又 到 达 一 个 死 端 ， 回 溯 到 M 点 ， 沿 着 路 径 MQT 搜索 ， 我 们 
终于 到 达 了 目标 。 注 意 : 针对 迷宫 问题 ， 这 种 搜索 方法 的 效率 比 广度 优先 搜索 (图 18-17 ) 


要 高 。 


2. 启发 式 搜索 

使 用 启发 式 搜索 ， 我 们 给 每 个 节点 赋 一 个 称 为 启发 值 (产值 ) 的 定量 值 。 这 个 定量 值 
显示 了 该 节点 与 目标 节点 间 的 相对 远近 。 例 如 ， 考 虑 。 初始 状态 目标 状态 
图 18-19 中 的 要 解决 的 8 数字 游戏 。 

假定 难题 的 初始 和 目标 状态 如 图 所 示 。 每 一 个 方 | i 中 
块 的 启发 值 是 它 到 目标 状态 要 移动 的 最 小 步 数 。 每 个 | |5|4| 1 7165 
状态 的 启发 值 是 这 个 状态 中 所 有 方块 的 启发 值 之 和 。 h=6 h=0 

表 18-2 显示 了 难题 的 初始 和 最 终 状 态 的 启发 值 。 图 18-19 启发 式 搜索 的 初始 和 目标 状态 


表 18-2 启发 值 


初始 状态 的 启发 值 | 0 | 
目标 状态 的 启发 值 | 0o | 
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开始 搜索 时 ， 我 们 考虑 下 一 层 所 有 可 能 的 状态 和 它们 的 启发 值 。 对 于 我 们 的 难 
题 ,一 步 移动 只 产生 两 个 可 能 的 状态 ,它们 以 及 有 值 显示 在 图 18-20 中 。 

接 下 来 ， 我 们 从 具有 较 小 产值 的 节点 开始 ， 画 出 下 一 层次 可 能 的 状态 。 我 们 继续 这 种 方 
法 ， 直 至 到 达 一 个 h 值 为 0 (目标 状态 ) 的 状态 ， 就 像 图 18-21 中 显示 的 一 样 。 难 题 的 解决 
路 径 在 图 中 是 用 粗 稍 头 表示 出 来 的 。 


初始 状态 


[7816|6 
图 


[514| 
ge 
| 1213] 1213 
| 1615 [7181617 
[71514 5| [4| 


图 18-20 第 一 步 的 启发 值 18-21 解决 8 数字 游戏 的 启发 式 搜索 


18.6 神经 网 络 


如 果 智 能 体 应 该 表现 得 像 人 类 一 样 ， 那 么 它 可 能 需要 学 习 。 学 习 是 一 种 复杂 的 生物 现 
象 ， 即 使 是 人 类 自己 也 没有 完全 理解 。 要 使 人 工 智能 体 学 习 肯 定 不 是 件 容 易 的 事情 。 但 是 ， 
在 过 去 已 经 有 好 几 种 方法 为 未 来 建立 了 希望 。 大 多 数 方法 使 用 了 归纳 学 习 或 从 例子 中 学 习 。 
这 意味 着 把 很 大 集合 的 问题 和 解法 都 给 计算 机 ， 让 计算 机 从 中 学 习 。 本 节 我 们 只 讨论 其 中 一 
种 方法 ， 它 可 以 不 必 使 用 复杂 的 数学 概念 来 描述 ， 它 就 是 神经 网 络 。 神 经 网 络 试图 使 用 神经 
元 网 络 去 模仿 人 脑 的 学 习 过 程 。 


18.6.1 生物 神经 元 细胞 核 


人 脑 中 有 数 以 亿 计 的 处 理 单 元 ， 称 为 神经 
元 。 每 个 神经 元 平均 与 数 以 千 计 的 其 他 神经 元 
相连 。 神 经 元 有 三 部 分 构成 : 胞 体 、 轴 突 和 树 网 休 “示人 仿 ， 
突 ， 如 图 18-22 所 示 。 树 状 晶体 元 的 连接 点 ) 
胞 体 (身体 ) 中 含有 细胞 核 : 它 是 处 理 器 。 图 18-22 一 个 神经 元 的 简化 图 
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树 突起 到 输入 设备 的 作用 : 它 接收 其 他 神经 元 的 输入 。 轴 突起 到 输出 设备 的 作用 : 它 把 输出 
送 到 其 他 神经 元 。 神 经 键 是 神经 元 的 轴 突 和 其 他 神经 元 的 树 突 的 连接 点 。 树 突 从 相 邻 的 神经 
元 中 收集 电信 号 ， 把 它 传 给 胞 体 。 神 经 键 的 工作 就 是 给 传 到 相 邻 神经 元 的 信号 上 加 上 权重 : 
它 根据 产生 的 化 学 物质 的 数量 来 判断 是 强 连接 还 是 弱 连接 。 

一 个 神经 元 有 两 种 状态 : 兴奋 和 抑制 。 如 果 接 收 的 信号 总 量 达到 一 个 阐 值 ， 身 体 就 兴 
奋 ， 并 触发 一 个 输出 信号 ， 该 信号 传 给 轴 突 ， 最 终 传 给 其 他 的 神经 元 。 如 果 接 收 的 信号 总 量 
没有 达到 阔 值 ， 神 经 元 仍然 处 于 抑制 状态 : 它 不 触发 或 产生 输出 。 


18.6.2 感知 器 

感知 器 是 一 个 类 似 于 单个 生物 神经 元 的 人 工 神经 元 。 它 带 有 一 组 具有 权重 的 输入 ， 对 输 
人 和 人 求 和 ， 把 结果 与 阔 值 进行 比较 。 如 果 结果 大 于 i 
阔 值 ， 感 知 器 触发 ， 否则， 不 触发 。 当 感知 器 触 Ce 
发 时 ， 输 出 为 1; 不 触发 , 输出 为 0。 图 18-23 | 输出 
显示 了 一 个 带 有 5 个 输入 (x ~x) 和 5 个 权 ER Oe 
重 (wi ~ ws ) 的 感知 器 。 在 这 个 感知 器 中 ， 如 wy 
果 T 是 阔 值 ， 输 出 值 确定 如 下 : mn 


图 18-23 一 个 感知 器 


S= (Xi1. Wit+X2.W2+X3. Wa3+X4. Wa+Xs. Ws) 
if s>T， 那么 y=1; 否则 y=0 


例 18.7 假设 一 个 有 三 个 输入 和 一 个 输出 的 例子 ， 有 四 个 已 知 的 输入 /输出 ， 显 示 在 下 
表 中 @: 





这 组 输入 被 用 来 训练 一 个 具有 等 权重 的 (wi = wz = ws ) 感知 器 ， 阔 值 设 置 为 0.8， 所 有 
输入 的 原始 权重 为 50%。 如 果 产 生 的 输出 是 正确 的 (也 就 是 ， 与 实际 的 输出 匹配 )， 那 么 权 
重 保持 原来 的 值 。 如 果 产 生 的 输出 小 于 输出 数据 ， 那 么 权重 将 上 升 10%; 如 果 产 生 的 值 大 于 
输出 数据 ,那么 权重 将 下 降 10%。 下 表 显 示 了 应 用 先前 的 例子 训练 感知 器 的 过 程 。 


PECE TIENELCI 
i 而 二 末 S 古 5 





注意 : 即使 是 很 小 的 可 用 数据 集 ， 感 知 器 也 能 被 训练 。 在 实际 应 用 场合 ， 感 知 器 总 是 被 
一 个 大 得 多 的 训练 数据 集训 练 ( 100 或 1000 个 事例 )。 训 练 之 后 ， 感 知 器 准备 接收 新 的 输入 


日 ” 原 书 该 表 和 下 表 的 第 2 行 数据 有 误 。 根 据 文中 推断 ， 译 者 将 数据 更 正 ， 并 使 之 与 结论 一 致 。 一 一 译 者 注 。 
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数据 ， 产 生 一 个 可 接受 的 正确 的 输出 。 
18.6.3 ”多 层 网 络 


几 个 层次 的 感知 器 可 以 组 合 起 来 ， 形 成 多 层 
神经 网 络 。 每 一 层 的 输出 变 成 下 一 层 的 输入 。 第 
一 层 称 为 输入 层 ， 中 间 层 称 为 隐藏 层 ， 最 后 一 层 
称 为 输出 层 。 输 入 层 中 的 节点 不 是 神经 元 ， 它 们 
是 分 配器 。 隐 藏 的 节点 通常 用 来 给 上 一 层 的 输 
出 加 上 权重 的 。 图 18-24 显示 了 一 个 三 层 的 神经 


网 络 。 





输入 节点 隐藏 节点 输出 节点 
图 18-24 一 个 多 层 的 神经 网 络 


18.6.4 ”应 用 


当 有 足够 的 预先 定义 的 输入 和 输出 时 ， 就 可 以 使 用 神经 网 络 。 两 个 证 明神 经 网 络 有 用 的 
领域 是 光学 字符 识别 (OCR) (智能 体 读 任何 的 手写 体 ) 和 信用 赋值 (不 同 的 因素 赋予 不 同 的 
权重 去 建立 信用 等 级 ， 例 如 用 于 贷款 申请 )。 


18.7 


章 末 材料 


推荐 读物 
有 关 本 章 所 讨论 主题 的 更 详细 资料 ， 可 以 参考 下 列 书籍 : 


小 结 


Gawsey, A. The Essence of Artificial Intelligence, Upper Saddle River, NJ:Prentice Hall, 
1998 

Luger, G. Artificial Intelligence: Atructures and Strategies for Complex Problem 
Solving, Reading, MA: Addison Wesly, 200 

Winston, P. Artificial Intelligence, Reading, MA: Addison Wesley, 1993 

Coppin, B. Artificial Intelligence llluminated, Sudbury, MA: Jones and Bartlett, 2004 
Russel, S. and Norvig, P. Artificial Intelligence: A Modern Approach, Upper Saddle 
River, NJ: Prentice Hall, 2003 

Dean, T. Artificial Intellegence: Theory and Practice, Redwood City, Reading, 
MA:Addison Wesley, 2002 


人 工 智 能 是 编程 系统 的 研究 ， 它 能 在 一 定 程度 上 模仿 人 类 的 活动 ， 如 感知 、 思 考 、 
学 习 和 动作 。 定 义 人 工 智能 的 一 种 方法 是 图 灵 测 试 ， 它 比较 人 类 和 机 器 的 智能 行为 。 
智能 体 是 一 个 能 感知 环境 、 从 环境 中 学 习 并 智能 地 与 环境 交互 的 系统 。 智 能 体 可 以 
分 成 两 大 类 : 软件 智能 体 和 物理 智能 体 。 

虽然 通用 的 语言 (如 C、C++ 和 Java) 能 用 来 创建 智能 软件 ， 但 有 两 种 专门 为 人 工 智 
能 设计 的 语言 : LISP 和 PROLOG。 

知识 表示 是 人 工 智 能 的 第 一 步 。 我 们 讨论 了 4 种 常见 的 知识 表示 方法 : 语义 网 、 框 
架 、 谓 词 逻 辑 和 基于 规则 的 系统 。 语 义 网 使 用 有 向 图 表示 知识 。 框 架 与 语义 网 紧密 
相关 ， 其 中 数据 结构 (记录 ) 用 来 表示 相同 的 知识 。 谓 词 逻辑 可 以 表示 一 个 良好 定义 
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的 语言 ， 该 语言 在 理论 逻辑 的 悠久 历史 中 得 到 发 展 。 基 于 规则 的 系统 使 用 一 组 可 以 
从 已 知事 实 推导 出 新 事实 的 规则 来 表示 知识 。 

e 人 工 智能 的 一 个 目标 是 建立 专家 系统 ， 完 成 通常 需要 人 类 专家 经 验 的 任务 。 它 们 可 
以 用 在 人 类 专家 缺少 、 昂 贵 或 不 可 用 等 场合 。 

e 人 工 智 能 的 另 一 个 目标 是 创造 行为 像 普 通 人 类 的 机 器 。 这 个 目标 的 第 一 部 分 涉及 图 
像 处理 或 计算 机 视觉 ， 这 是 处 理 对 象 感知 的 一 个 人 工 智 能 领域 。 目 标的 第 二 部 分 是 
自然 语言 的 语言 处 理 、 分 析 和 翻译 。 

。 在 人 工 智 能 中 ， 问 题 求解 的 一 种 技术 是 搜索 。 搜 索 可 以 描述 成 使 用 一 组 状态 (情形 ) 
求解 一 个 问题 。 有 两 大 类 搜索 ， 分 别 是 蛮 力 搜索 和 启发 式 搜索 。 

e 如 果 智 能 体 应 该 表现 得 像 人 类 一 样 ， 那 么 它 可 能 就 需要 学 习 。 已 经 使 用 的 方法 中 有 
几 种 为 未 来 建立 了 希望 。 大 多 数 方法 使 用 归纳 学 习 和 从 例子 中 学 习 。 一 个 通常 的 方 
法 是 使 用 神经 网 络 ， 使 用 神经 元 网 络 试图 模仿 人 脑 的 学 习 过 程 。 


18.8 练习 
小 测验 


在 本 书 网 站 上 提供 一 套 与 本 章 相关 的 交互 式 试 题 。 强 烈 建议 学 生 在 继续 本 章 习 题 前 首先 
完成 相关 测验 以 检测 对 本 材料 的 理解 。 


复习 题 


1. 描述 图 灵 测 试 。 你 认为 该 测试 能 用 来 准确 地 定义 一 个 智能 系统 吗 ? 
2 定义 一 个 智能 系统 ， 列 出 两 大 类 智能 体 。 

3. 比较 人 工 智 能 中 使 用 的 语言 LISP 和 PROLOG。 

4. 描述 知识 表示 的 需要 ， 列 出 本 章 所 讨论 的 4 种 不 同 的 表示 方法 。 
5. 比较 谓词 逻辑 和 命题 逻辑 。 

6. 比较 框架 和 语义 网 。 

7. 定义 一 个 基于 规则 的 系统 ， 并 与 语义 网 进行 比较 。 

8. 比较 专家 系统 和 平凡 系统 。 

9. 列 出 图 像 处 理 的 步骤 。 

10. 列 出 语言 处 理 的 步骤 。 

11. 定义 神经 网 络 ， 它 是 如 何 模仿 人 类 的 学 习 过 程 的 ? 

12. 定义 感知 器 。 


练习 题 


1. 画 一 个 语义 网 ， 显 示 下 列 人 物 间 的 关系 : 主治 医生 、 家 庭 从 业者 、 遗 传 生态 学 、 实 习 医 生 、 工 程 师 、 
会 计 师 ， 法 国家 庭 从 业者 Pascal 博士 。 

. 把 练习 题 1 中 的 语义 网 表示 成 一 组 框架 。 

.使 用 符号 R 表示 句子 “It is raining”， 符 号 S 表示 句子 “It is sunny”， 用 命题 逻辑 写 下 列 的 英语 句子 。 


LO MD 


a. It is not raining. b. It is not sunny. 
c. It is neither raining nor sunny. d. It is raining and sunny. 
e.If it is sunny, then it is not raining. f Ifit is raining, then it is not sunny. 


g. It is sunny if and only if it is not raining. h. It is not true that if it is not raining, it is sunny- 
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ua 


CN 


Oo 


\ 


. 如 果 符 号 C、W 和 互 分 别 代 表 “it is cold”、“it is warm” 和 “itis hot” 。 写 出 下 列 命题 逻辑 中 的 句 
子 对 应 的 英语 句子 : 
a.—H b.WVH c.WA 人 AH d.W A (—H) 
e.— (WA H) fwWw—H g. (一 C) 一 W h.— (W—H). 
i. HH 一 (一 W) j.((—C) AH)V (CV (一 H)) 
.使 用 符号 Wh、Re、Gr 和 Fl 分 别 代 表 谓 词 “is white” “is red”“is green” 和 “is aflower”， 用 
谓词 逻辑 写 下 列 的 句子 : 
a. Some flowers are white. b. Some flowers are not red. 
c. Not all flowers are red. d. Some flowers are either red or white. 
e. There is not a green flower. f. No flowers are green. 


g. Some flowers are not white. 


.使 用 符号 Has、Loves、Dog 和 Cat 代表 谓词 “has”“1loves” “is a dog” 和 “is a cat”， 用 谓词 逻 
辑 写 下 列 句子 : 
a. John has a cat. b. John loves all cats. 
c. John loves Anne. d. Anne loves some dogs. 
e. Not everything John loves is a cat. f. Anne does not like some cats. 
g. If John loves a cat, Anne loves it. h. John loves a cat if and only if Anne loves it. 
.用 符号 Expensive、Cheap、Buys 和 Sells 分 别 代 表 谓 词 :“ is expensive”、“ is che-ap”、“ buys” 和 
“sells”， 用 谓词 逻辑 写 下 列 句子 : 
a. Everything is expensive. b. Everything is cheap. 
c. Bob buys everything that is cheap. d. John sells everything expensive. 
e. Not everything is expensive. f. Not evertything is cheap. 


g. If something is cheap, then it is not expensive. 
.用 符号 Identical 代表 谓词 “is identical to”， 用 谓词 逻辑 写 下 列 句子 ， 注 意 谓词 “ equal” 需 要 两 个 
参数 。 
a. John is not Anne. b. John exists. 
c. Anne does not exist. | d. Something exists. 
e. Nothing exists. f. There are at least two things. 
.用 真 值 表 检查 下 面 的 论断 是 否 合法 。 
{PQ, P}|-Q 


10. 用 真 值 表 检 查 下 面 的 论断 是 否 合法 。 


1 


1 


1 


{PV Q, P} |-Q 

1. 用 真 值 表 检查 下 面 的 论断 是 否 合法 。 
{PA Q, P}I-Q 

2. 用 真 值 表 检查 下 面 的 论断 是 否 合法 。 
让 一 QQ 一 人) 上 -下 一 R) 

3. 画 出 一 个 能 模拟 OR 门 的 神经 网 络 。 


14. 画 出 一 个 能 模拟 AND 门 的 神经 网 络 。 


1 


5. 图 18-25 显示 了 8 数字 游戏 的 初始 和 目标 状态 ， 画 出 解决 这 一 


难题 的 启发 式 搜索 树 。 初始 状态 目标 状态 
16. 显示 出 图 18-26 中 的 树 形 图 的 广度 优先 搜索 。 [3 [23 
17. 显示 出 图 18-26 中 的 树 形 图 的 深度 优先 搜索 。 71216| 一 一 一 |4|5|6| 
18. 画 出 图 18-27 中 的 迷宫 的 树 形 图 。 | [sls| [7|s| | 


19. 画 出 练习 题 18 中 的 树 并 显示 出 广度 优先 搜索 。 图 18-25 练习 题 15 
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图 18-26 练习 题 16 图 18-27 练习 题 18 
20. 画 出 练习 题 18 中 的 树 并 显示 出 深度 优先 搜索 。 
小 程序 


为 了 模拟 每 章 中 讨论 的 一 些 概念 ， 我 们 编写 了 一 些 Java 的 小 程序 。 强 烈 建议 学 生 通过 
尝试 这 些 应 用 程序 来 加 深 对 每 章 讨论 材料 的 理解 。 


| 附录 A 


Foundations of Computer Science, Third Edition 


Unicode 


计算 机 使 用 的 是 数字 ， 它 们 通过 给 字符 赋 一 个 数字 值 来 储存 字符 。 最 早 的 编码 系统 称 为 
ASCII ( American standard code for information interchange， 美 国标 准 信 息 交 换 码 )， 其 中 有 
128 个 字符 (0 ~ 127 )， 每 一 个 字符 用 7 位 二 进 制 数 来 存储 。ASCII 能 很 好 地 处 理 小 写字 母 、 
大 写字 母 、 数 字 、 标 点 符号 和 一 些 控 制 字 符 。 后 来 又 把 ASCII 字符 集 扩 充 为 8 位， 新 的 编 
码 称 为 扩展 ASCII， 它 不 再 是 国际 标准 了 。 

为 了 克服 ASCII 和 扩展 ASCII 中 国有 的 困难 (没有 足够 的 位 数 来 表示 其 他 语言 通信 中 需 
要 的 字符 和 符号 )，Unicode 协会 (一 个 多 种 语言 软件 制造 团体 ) 建立 了 一 个 通用 的 编码 系统 ， 
提供 全 面 的 字符 集 ， 称 为 Unicode (统一 字符 编码 ) 。 

起 初 ，Unicode 是 2 字 节 字符 集 ， 后 来 ，Unicode 第 5 版 改 成 了 4 字 节 编码 ， 并 与 ASCII 
和 扩展 ASCII 完全 兼容 。ASCII 现在 称 为 基本 Latin， 它 的 Unicode 码 中 高 25 位 设 为 0 ; 扩 
展 ASCII 现在 称 为 Latin-1， 它 的 Unicode 码 中 高 24 位 设 为 0。 图 A-1 显示 了 不 同系 统 是 如 


何 兼 容 的 。 
扩展 ASCII 
定义 平面 ASCII 
_ Unicode | 


图 A-1 Unicode 兼容 性 


在 Unicode 中 ， 每 个 字符 或 符号 被 定义 成 32 位 的 数字 。 这 种 编码 能 定义 22 (4 294 967 296 ) 
个 字符 或 符号 。 这 里 用 如 下 格式 的 十 六 进 制 数字 来 描述 。 其 中 每 个 X 代表 一 个 十 六 进 制 数 。 


U+XXXXXXXX 


A.1 平面 


Unicode 把 整个 编码 空间 分 割 成 平面 。 最 高 的 16 位 定义 平面 ， 这 意味 着 我 们 有 
65 536(2') 个 平面 。 对 于 平面 0， 最 高 的 16 位 全 是 0，(0000)ie, 平面 1 是 (0001)ie, 平面 
2 是 (0002)i6， 等 等 ， 直 到 平面 65 536， 它 是 (FFFF)ie。 每 个 平面 能 定义 65 536 个 字符 或 符 
号 。 图 A-2 显示 了 Unicode 编码 空间 的 结构 和 平面 。 

1. 基本 多 语言 平面 (BMP) 

基本 多 语言 平面 (平面 0 ) 是 用 来 与 先前 16 位 Unicode 兼容 的 。 在 这 个 平面 中 最 高 的 16 
位 全 设 为 0。 编 码 通常 显示 成 U + XXXX 的 形式 ， 其 中 的 XXXX 是 低 16 位 。 这 个 平面 大 多 用 
来 定义 不 同 语言 中 的 字符 集 ， 除 了 少数 控制 代码 或 特殊 字符 代码 (更 多 信息 ， 请 参见 Unicode 
网 页 )。 

2. 其 他 平面 

Unicode 还 有 其 他 平面 : 
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nm QQ 二 © 
一 一 一 一 
Sa 
己 oO oD 





0000: 基本 多 语言 平面 ( BMP ) 000E: 辅助 特殊 平面 (SSP ) 
0001: 辅助 多 语言 平面 (SMP ) 000F: 私有 用 户 平面 (PUP ) 
0002: 辅助 象形 文字 平面 (SIP ) 0010: 私有 用 户 平面 (PUP ) 


图 A-2 Unicode 平面 


辅助 多 语言 平面 (平面 (0001)is ) 用 来 为 那些 没有 包含 在 BMP 平面 中 的 多 语言 字符 
提供 更 多 的 编码 。 

辅助 象形 文字 平面 (平面 (0002)16 ) 用 来 为 象形 文字 提供 编码 ， 这 些 文字 像 声 音 或 发 
音 一 样 表示 一 种 思想 或 意思 。 

辅助 特殊 平面 (平面 (000E)ie ) 用 来 表示 不 在 基本 Latin 和 Latin-1 中 的 特殊 字符 。 
私有 用 户 平面 (平面 (000F)is 和 平面 (0010)is ) 为 私有 用 户 预 留 。 


A.2 ASCIl 


如 今 ，ASCII 或 基本 Latin 都 是 Unicode 的 一 部 分 。 它 占据 了 Unicode 中 的 前 128 个 编 
码 (U-00000000 到 U-0000007F)。 表 A-1 包含 了 十 六 进 制 编码 和 符号 。 要 找到 实际 的 编码 ， 
要 把 (000000)is 加 到 各 个 编码 的 前 面 。 


表 A-1 ASCII 


rE 


(09)i6 (17)i6 ETB (25)i6 % (33)ie 


~ | 人 |wm| 上 | mlb 
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( 续 ) 
oa | co | ww wew| 


ASCII 的 一 些 特性 

ASCII 具有 一 些 有 趣 的 特性 ， 这 里 简单 介绍 一 下 : 

1 ) 第 一 个 编码 (00)is 是 一 个 不 可 打印 字符 ， 也 是 一 个 空 字符 。 它 表示 不 是 任何 字符 。 

2 ) 最 后 一 个 字符 (7F)i6 是 一 个 删除 字符 ， 也 是 一 个 不 可 打印 字符 。 有 些 程序 用 这 个 字 
符 来 删除 当前 字符 。 

3 ) 空格 字符 (20)is 是 一 个 可 打印 字符 ， 它 打印 一 个 空格 。 

4) 编码 (01)16 到 (1F)is 的 字符 是 控制 字符 ， 它 们 不 可 打印 ， 表 A-2 显示 了 它们 的 功能 ， 
这 个 字符 中 的 大 部 分 用 在 过 时 协议 的 数据 通信 中 。 

表 A-2 ”控制 字符 的 解释 
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( 续 ) 
解 释 


TE | 
TI 
| 


Cancel 


End of medium 


DC4 File separator 
wr 
sm 


5 ) 大 写字 和 母 从 (41)io 开始 ， 小 写字 母 从 (61)ie 开始 。 当 进行 数字 上 的 比较 时 ， 大 写字 
母 小 于 小 写字 母 ， 这 意味 着 当 我 们 基于 ASCII 值 排序 一 个 表 时 ， 大 写字 母 将 显示 在 小 写字 
母 之 前 。 

6 ) 大 写字 母 和 小 写字 母 在 7 位 编码 中 只 有 一 位 是 不 同 的 。 例 如 ， 字 符 A 是 (41)is， 而 
a 是 (61)is, 不同 的 位 是 第 6 位 ， 它 在 大 写字 母 中 是 0， 而 在 小 写字 母 中 是 1。 如 果 我 们 知道 
一 种 写法 的 编码 ， 可 以 很 容易 地 找到 另 一 种 写法 的 编码 ， 通 过 在 十 六 进 制 数 上 加 减 (20)i6， 
或 反 转 第 6 位 。 换 言 之 ,字符 A 的 编码 是 (41)is=(1000001),， 字 符 a 的 编码 是 (61)16= 
(1100001):， 二 进 制 数 中 的 第 6 位 从 0 反 转 成 1。 

7 ) 大 写字 母后 面 不 是 紧 跟 着 小 写字 母 的 ， 这 其 中 有 些 标 点 字符 。 

8 ) 十 进 制 数 字 (0 一 9) 从 (30)ie 开始 ， 这 意味 着 如 果 我 们 要 把 一 个 数字 字符 转化 为 它 
对 应 的 作为 整数 的 值 ， 我 们 需要 从 中 减 去 (30)i6=48。 例 如 ，8 在 ASCII 中 的 编码 是 (38)i5= 
56， 要 找到 它 所 对 应 的 值 ， 我 们 需要 从 中 减 去 48， 即 56-48=8。 


Group separator 
Record separator 


Unit separator 
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Foundations of Computer Science, Third Edition 


UML 


统一 建 模 语言 (Unified Modeling Language，UML) 是 一 种 用 来 进行 分 析 和 设计 的 图 形 
化 语言 。 通 过 UML， 我 们 可 以 用 标准 的 图 形 概念 来 说 明 、 可 视 化 、 构 造 和 用 文档 说 明 软 件 
和 硬件 系统 。UML 提供 了 不 同 层次 的 抽象 ， 称 为 视图 ， 如 图 B-1 所 示 。 


UML 视 图 





口 用 例 图 口 类 图 口 协作 图 口 组 件 图 
口 顺序 图 口 配置 图 
口 状态 图 
口 活动 图 


图 B-1 UML 视图 _ 


4 个 视图 是 : 

1 ) 用 户 视 图 ， 它 显示 用 户 与 系统 间 的 交互 ， 这 个 视图 用 用 例 图 来 表示 。 

2 ) 结构 视图 ， 它 显示 了 系统 的 静态 结构 ， 这 个 视图 用 类 图 来 表示 。 

3 ) 行为 视图 ， 它 显示 了 对 象 在 系统 中 的 行为 ， 这 个 视图 用 协作 图 、 顺 序 图 、 状 态 图 和 
活动 图 来 表示 。 

4 ) 实现 视图 ， 它 显示 系统 是 如 何 实现 的 ， 它 包含 组 件 图 和 配置 图 。 


B.1 用 户 视图 


用 户 视图 是 整个 系统 的 高 层 视图 ， 它 显示 系统 在 总 体 上 是 如 何 组 织 的 。 在 用 户 视图 中 只 
有 一 种 图 ， 用 例 图 。 


用 例 图 


一 个 工程 通常 是 从 用 例 图 开始 的 ， 用 例 图 给 出 了 
系统 的 用 户 视图 : 它 显示 了 用 户 是 如 何 与 系统 通信 的 。 
图 B-2 显示 了 一 个 用 例 图 的 例子 。 用 例 图 使 用 4 个 主 
要 的 组 成 部 分 : 系统 、 用 例 、 行 动 者 和 关系 ， 每 个 组 疝 震 成 绩 
成 部 分 解释 如 下 。 

1. 系统 

系统 执行 一 个 功能 ， 我 们 只 对 计算 机 系统 感 兴 
趣 。 在 用 例 图 中 的 计算 机 系统 用 矩形 框 显示 ， 在 框 外 
左上 角 标 上 系统 的 名 字 。 图 B-2 用 例 图 
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2. 用 例 

系统 包含 许多 表示 成 用 例 的 行为 。 每 个 用 例 定 义 了 一 个 能 被 系统 用 户 所 采取 的 行为 。 在 
用 例 图 中 用 带 圆 角 的 矩形 表示 用 例 。 

3. 行动 者 

行动 者 是 使 用 系统 的 某 人 或 某 事 。 虽 然 行动 者 是 以 棍 状 轮廓 来 显示 ， 但 它们 并 不 必要 代 
表 人 类 。 

4. 关系 

关系 是 行动 者 和 用 例 间 的 联系 。 关 系 是 用 行动 者 到 用 例 间 的 连 线 来 表示 的 。 一 个 行动 者 
可 以 关联 多 个 用 例 ， 同 样 一 个 用 例 可 以 被 多 个 行动 者 关联 。 


B.2 ”结构 视图 
结构 视图 显示 了 系统 、 类 和 它们 的 关系 等 静态 特性 。 结 构 视图 用 一 种 图 来 表示 : 类 图 。 


类 图 


类 图 表明 系统 的 静态 结构 ， 它 显示 了 类 的 特性 和 类 间 的 关系 。 类 的 符号 是 一 个 把 类 名 写 
在 里 面 的 矩形 。 图 B-3 显示 了 属于 不 同系 统 的 三 个 类 : 人 、 分 数 和 电梯 ， 这 就 是 说 它们 之 间 


没有 任何 关系 。 

类 图 通过 对 图 增加 属性 、 类 型 和 方法 
得 到 扩展 。 类 间 的 关系 用 联合 图 和 泥 化 图 图 B-3 类 的 符号 
来 显示 。 

1. 属性 和 类 别 

类 符号 可 以 包含 在 分 离间 隔 间 中 的 属性 和 类 型 ， 属 性 是 一 个 类 的 特性 ， 类 型 用 来 表示 这 
个 属性 值 的 数据 类 型 。 图 B-4 显示 了 人 和 分 数 这 两 个 类 的 一 些 属性 。 





人 
name: string 
age: integer 

2. 方 法 


类 也 可 以 被 扩展 成 包含 方法 。 方 法 就 是 一 个 能 被 对 象 (类 的 一 个 实例 ) 使 用 或 应 用 到 一 
个 对 象 上 的 过 程 。 换 言 之 ,一 个 对 象 既是 行为 者 ， 也 是 接受 者 。 图 B-5 显示 了 两 个 带 有 属性 
和 方法 的 类 。 属 性 和 方法 被 列 在 分 离 的 间隔 间 中 。 


分 数 





numerator: integer 
denominator: integer 属性 和 类 型 


图 B-4 加 到 类 符号 中 的 属性 


类 分 数 


name: string numeraor: integer 
age: integer denominator: integer 


printName slalay 
incrementAge Elele| 





图 B-5 加 到 类 符号 中 的 属性 和 方法 
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3. 关联 

关联 是 两 个 类 间 的 概念 上 的 关系 。 关 联 用 两 个 类 间 的 实 线 来 显示 。 如 果 关 联 有 名 字 ， 那 
它 被 写 在 线 的 旁边 ， 并 带 上 实心 箭头 。 

关联 可 以 是 : 一 对 一 、 一 对 多 、 多 对 一 或 多 对 多 。 图 B-6 显示 了 4 个 类 和 它们 间 的 一 
些 关联 。 它 显示 一 个 教授 (教授 类 的 一 个 对 象 ) 可 以 教 1 ~ 5 门 课程 (1…5 )。 相 反 地 ， 在 
这 个 例子 中 ,一 门 课程 只 能 有 一 位 教授 。 大 学 (大 学 类 的 一 个 对 象 ) 可 以 有 许多 教授 和 学 生 
(学 生 类 的 对 象 )， 在 关联 线 上 用 星 号 (*) 指示 。 图 中 还 显示 了 一 个 学 生 可 以 选 多 门 课程 。 


十 有 十 教 mw 1..5 









图 B-6 类 间 的 关联 
4. 泛 化 
泛 化 基于 类 间 的 相似 性 和 差异 来 组 织 类 。 泛 化 允许 我 们 定义 子 类 和 超 类 。 子 类 继承 了 它 
所 有 的 超 类 的 特性 (属性 和 方法 )， 但 通常 它 有 自己 的 一 些 特性 (属性 和 方法 )。 图 B-7 显示 
了 单 继承 和 多 继承 。 
超 类 超 类 超 类 


全 







Vehicle 





Vehicle 


子 类 子 类 子 类 
a) 两 个 子 类 继承 一 个 超 类 b) 一 个 子 类 继承 两 个 超 类 
图 B-7 泛 化 (继承 ) 
B.3 行为 视图 


行为 视图 显示 系统 中 的 对 象 行为 。 取 决 于 行为 的 种 类 ， 有 4 类 不 同 的 图 : 协作 图 、 状 态 
图 、 顺 序 图 和 活动 图 。 


B.3.1 协作 图 
协作 图 与 类 图 相似 。 区 别 在 于 类 图 显示 了 类 间 的 关系 ， 而 协作 图 显示 了 对 象 (类 的 实例 ) 
间 的 关系 。 
oO 
的 名 字 。 对 于 匿名 的 对 象 ， 对 象 的 名 字 被 省 去 。 图 B-8 显示 了 从 类 Person 实例 化 的 三 个 对 象 。 
a) 一 个 名 为 John 的 对 象 b) 一 个 名 为 Anne 的 对 象 c) 一 个 匿名 的 对 象 
图 B-8 从 同一 类 实例 化 的 三 个 对 象 


348 奉 录 号 


1. 属性 和 值 
属性 是 类 的 特性 ， 而 值 是 对 象 对 应 属性 的 特性 。 对 象 符号 可 以 包含 值 。 图 B-9 显示 了 类 
Person 和 Fraction 的 一 些 属 性 和 在 类 中 这 些 属 性 的 值 。 





Anne:Person Frl:Fraction 
name = "Anne" numerator = 7 
| lo 
a) 一 个 Person 的 对 象 b) 一 个 Fraction 的 对 象 
B-9 属性 和 值 的 例子 

2. 方法 和 操作 
虽然 对 象 符号 也 可 以 包含 方法 和 操作 ， 但 在 协作 图 中 并 不 常见 。 
3. 链接 


在 协作 图 中 ， 链 接 是 类 图 中 关联 的 一 个 实例 。 对 象 可 以 使 用 链接 与 其 他 对 象 关 联 。 用 两 
个 原型 记号 来 表示 链接 : 本 地 和 参数 。 第 一 个 显示 一 个 对 象 把 另外 一 个 对 象 当 成 局 部 变量 来 
使 用 ;第 二 个 显示 一 个 对 象 把 另外 一 个 对 象 当 作 参 数 来 使 用 。 多 样 性 (在 图 B-6 中 学 生 和 课 
程 间 的 关联 显示 的 ) 也 可 以 用 多 重 到 的 对 象 来 表示 。 多 样 性 也 可 以 在 同一 类 对 象 间 显示 。 
图 B-10 显示 了 学 生 对 象 使 用 多 门 课程 作为 参数 。 

4. 消息 

一 个 对 象 可 以 向 另外 一 个 对 象 发 送 消息 。 消 息 可 以 表示 从 一 个 对 象 发 送 到 另外 一 个 对 
象 的 事件 。 消 息 也 可 以 调用 另外 一 个 对 象 中 的 方法 。 最 后 ， 对 象 可 以 使 用 消息 创建 或 销毁 
另外 一 个 对 象 。 消 息 用 箭头 来 表示 ， 箭 头 代 表 了 消息 的 方向 ， 显 示 在 对 象 间 的 链接 上 面 。 
图 B-11 显示 了 一 个 Editor 对 象 向 Print 对 象 发 送 了 一 个 打印 的 消息 。 


print 
:Student :Course :Editor > :Printer 





图 B-10 对 象 间 的 链接 图 B-11 从 一 个 对 象 发 送 到 另 一 个 对 象 的 消息 
B.3.2 ”状态 图 
状态 图 用 来 显示 单个 对 象 在 状态 上 的 变化 。 对 象 在 响应 一 个 事件 时 会 引起 状态 上 的 变 
化 。 例 如 ， 当 一 个 开关 被 打开 时 ， 它 的 状态 就 从 关 变 成 了 开 。 一 台 洗衣 机 在 响应 定时 器 的 触 
发 时 ， 可 能 会 从 洗涤 状态 到 漂洗 状态 。 
1. 符号 
状态 图 主要 使 用 三 种 符号 ， 如 图 B-12 所 示 。 


@ 开始 状态 Cs ] 大 决策 点 
@ krwt 中 间 状态 一 一 > 转换 
图 B-12 状态 图 中 使 用 的 符号 
(1) 状态 


有 三 个 符号 表示 状态 : 开始 状态 、 停 止 状态 和 中 间 状 态 。 开 始 状态 被 画 成 黑 圆圈 ， 名 字 
写 在 圆圈 的 旁边 ， 在 图 中 只 人 允许 一 个 。 停 止 状态 被 画 成 一 个 实心 的 黑 圆圈 ， 在 另外 一 个 圆圈 
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的 里 面 ， 在 图 中 可 以 重复 。 中 间 状 态 被 画 成 圆 角 的 和 矩形， 状态 的 名 字 在 和 矩形 里 面 。 

(2 ) 转换 

在 状态 图 中 ， 转 换 是 状态 间 的 运动 。 转 换 符 号 是 两 个 状态 间 的 带 箭头 的 线 。 箭 头 显 示 了 
下 一 个 状态 。 离 开 一 个 状态 的 转换 有 一 个 或 多 个 ， 到 达 一 个 状态 的 转换 只 能 是 一 个 。 

(3 ) 决策 点 

决策 点 用 葵 形 来 表示 ， 基 于 对 象 中 的 数据 或 条 件 转换 可 以 走 多 条 路 径 。 

2. 事件 

在 状态 图 中 ， 对 象 能 被 一 个 事件 触发 ， 该 事件 可 以 是 外 部 的 或 内 部 的 。 例 如 ， 当 一 个 开 
关 被 打开 时 ， 它 就 从 关 状 态 切换 到 开 状态 。 事 件 用 字符 串 来 表示 ， 该 字符 串 定义 了 处 理 这 个 
事件 类 中 的 操作 。 它 可 能 有 括号 ， 包 含 传递 给 操作 的 形式 参数 。 事 件 也 可 以 有 括 在 括号 中 的 
条 件 。 下 面 显示 了 一 个 事件 的 例子 : 


withdraw (amount) [amount<balancel] 

当 被 一 个 事件 触发 时 ， 一 个 对 象 可 能 或 可 能 不 转 到 另 一 个 状态 。 

3. 动 作 

虽然 动作 能 被 多 种 方法 触发 ， 但 我 们 只 提 到 动作 被 事件 触发 。 动 作用 字符 串 来 表示 ， 它 
通常 定义 另外 一 个 对 象 和 被 这 个 对 象 调 用 的 事件 。 如 果 目 标 对 象 需要 参数 ， 它 们 被 括 在 括号 
里 。 动 作用 斜 杠 〈/) 与 事件 分 开 ， 下 面 显 示 了 一 个 动作 的 例子 : 


deposit (amount) # add (balance) 


1 1 
事件 动作 
例 B.1 图 B-13 显示 了 状态 图 的 一 个 简单 的 例子 。 这 里 有 6 个 状态 (开始 状态 、 停 止 
状态 和 4 个 中 间 状 态 )、9 个 事件 和 4 个 动作 。 





图 B-13 ”状态 图 的 一 个 例子 


B.3.3 ”顺序 图 


顺序 图 显示 了 对 象 (或 行动 者 ) 间 在 一 段 时 间 内 的 交互 。 在 顺序 图 中 ， 对 象 (或 行动 者 ) 
作为 列 被 列 出 ， 而 时 间 在 概念 上 是 向 下 流 的 ， 用 垂直 的 虚线 表示 。 

符号 

顺序 图 主要 使 用 5 种 符号 ， 如 图 B-14 所 示 。 

(1) 行动 者 

行动 者 的 符号 是 我 们 在 用 例 图 中 使 用 的 同样 的 棍 状 轮廓 。 既 然 行动 者 也 能 与 对 象 通信 ， 
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那 它 就 是 顺序 图 的 一 部 分 。 


:对象 | ne 
行动 者 , L- 
生命 线 激活 
图 B-14 顺序 图 中 的 符号 
(2 ) 对 象 
对 象 (就 像 我 们 先前 见 到 的 一 样 ) 是 类 的 实例 ， 顺 序 图 表示 了 对 象 间 的 交互 。 
(3 ) 生命 线 


生命 线 用 垂直 的 实 线 或 虚线 表示 ， 表 示 顺 序 图 中 的 一 个 个 体 参 与 者 。 它 通常 顶 一 个 矩形 
作为 头 ， 和 矩形 中 含有 对 象 的 名 字 或 行动 者 。 垂 直线 代表 了 对 象 的 生命 期 限 ， 一 直 延 伸 到 对 象 
不 再 活动 的 那个 点 。 

(4) 激活 

激活 用 罕 的 实心 矩形 表示 ， 显 示 了 当 一 个 对 象 在 一 个 活动 中 被 调用 的 时 间 ， 也 就 是 它 
非 空 闲 时 。 例 如 ， 如 果 一 个 对 象 向 另外 一 个 对 象 发 送 了 一 个 消息 ， 正 等 待 响应 ， 在 这 段 时 间 
内 ， 对 象 被 调用 。 

(5 ) 消息 

消息 用 带 箭头 的 线 表 示 ， 显 示 了 对 象 (行动 者 ) 间 的 交互 。 

例 B.2 图 B-15 显示 了 顺序 图 的 一 个 简单 例子 ， 该 例子 中 有 一 个 行动 者 和 三 个 匿名 对 
象 ， 图 中 也 显示 了 并 发 : 第 一 个 对 象 在 收 到 第 一 条 消息 后 ， 并 发 地 送出 两 条 消息 : 一 条 给 行 


动 者 ， 另 一 条 给 第 二 个 对 象 。 
mr 有 
消息 2 : : 


息 





图 B-15 顺序 图 的 一 个 例子 


B.3.4 活动 图 

活动 图 显示 了 一 个 复杂 操作 的 分 解 或 一 个 过 程 分 解 成 一 组 简单 的 操作 和 过 程 。 活 动 图 
比 顺 序 图 更 详细 。 顺 序 图 强调 对 象 ， 而 活动 图 显示 的 是 由 一 个 或 多 个 对 象 进行 的 更 详细 的 操 
作 。 在 面向 对 象 的 程序 设计 中 的 活动 图 代替 了 过 程 程序 设计 中 的 传统 的 流程 图 。 但 是 ， 传 统 
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的 流程 图 只 能 显示 顺序 流 控制 ( 串 行 )， 而 活动 图 既 能 显示 顺序 流 控制 ， 又 能 显示 并 发 (并 
行 ) 流 控制 。 | 

符号 

活动 图 主要 使 用 6 种 符号 ， 如 图 B-16 所 示 。 


光 开始 点 Ea 决策 (分 支 或 融合 ) 活动 


©@® 终止 点 €— 一 转换 me 分 又 或 连接 
图 B-16 活动 图 中 使 用 的 符号 


(1) 活动 

活动 是 活动 图 中 的 一 步 。 我 们 用 圆 角 的 矩形 表示 一 个 活动 ， 活 动 的 名 字 在 和 矩形 框 内 。 一 
个 活动 的 详细 程度 应 该 与 整个 图 一 致 ， 如 果 对 某 个 活动 需要 更 详细 的 信息 ， 那 就 需要 画 个 新 
的 图 来 表示 。 

(2 ) 转换 

与 状态 图 相似 ， 活 动 图 中 的 转换 用 带 箭头 的 线 表 示 ， 箭 头 表示 了 动作 的 方向 。 

(3 ) 开始 点 和 终止 点 

活动 图 中 的 开始 点 是 一 个 带 单个 向 外 转换 的 实心 圆圈 ; 终止 点 是 带 有 单个 向 内 转换 的 一 
个 被 空心 圆 包 围 的 实心 圆 (公牛 眼 )。 图 中 只 能 有 一 个 开始 点 ， 而 逻辑 上 也 应 该 只 有 一 个 终 
止 点 , 但 为 了 图 的 可 读 性 ， 多 个 终止 点 是 允许 的 。 

(4 ) 决策 和 融合 

一 个 萎 形 表示 一 个 决策 或 融合 。 转 换 可 以 根据 条 件 走 多 条 路 径 。 当 作为 一 个 决策 点 来 使 
用 时 ， 葵 形 符号 只 能 有 一 个 人 口 ， 两 个 或 多 个 出 口 ; 当 作 为 融合 点 来 使 用 时 ， 萎 形 符号 有 两 
个 或 多 个 人 口 ， 但 只 能 有 一 个 出 口 。 

(5 ) 分 又 或 连接 

一 条 加 粗 线 表 示 并 行 处 理 中 的 分 叉 或 连接 。 分 叉 符 号 表示 两 个 或 多 个 线程 的 开始 ， 而 连 
接 符号 表示 线程 的 结束 。 

例 B.3 图 B-17 显示 了 活动 图 的 一 个 例子 ， 活 动 2 和 活动 3 是 并 发 执行 的 (并 行 处 理 )。 





图 B-17 活动 图 的 一 个 例子 
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B.3.5 泳 道 


有 时 活动 图 中 的 操作 是 由 不 同 对 象 或 行动 者 来 进行 的 。 为 了 显示 涉及 多 个 对 象 或 行动 
者 ， 泳 道 被 加 进 活 动 图 中 ， 如 图 B-18 所 示 。 





图 B-18 带 有 泳 道 的 活动 图 


B.4 ”实现 视图 
实现 视图 显示 最 终 产 品 是 如 何 实现 的 。 有 两 种 图 用 来 显示 实现 : 组 件 图 和 配置 图 。 


B.4.1 组 件 图 


组 件 图 显示 了 软件 的 组 成 部 分 (组 件 ) 和 它们 之 间 的 依赖 关系 。 组 件 用 带 有 两 个 小 矩形 
在 其 左边 上 的 矩形 来 表示 。 组 件 间 的 依赖 用 末端 有 箭头 的 虚线 表示 。 我 们 也 可 以 在 依赖 线 上 
使 用 老式 表示 法 ， 包 括 老式 的 关系 ， 如 <<report>>。 图 B-19 显示 了 一 个 组 件 图 。 


| PR <<report>> [| KE 
压缩 排序 生生 和。 邮件 列表 EE 和 


图 B-19 组 件 图 的 一 个 例子 





B.4.2 ”配置 图 


配置 图 显示 了 通信 链接 的 各 个 节点 。 
节点 用 立方 体 来 表示 ， 通 信 联 合用 两 个 节 
点 间 的 连 线 表示 。 一 个 节点 可 以 包含 一 个 
或 多 个 组 件 。 图 B-20 显示 了 一 个 简单 的 配 
置 图 。 图 B-20” 配置 图 的 一 个 例子 
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伪 代 码 





定义 算法 最 常用 的 工具 之 一 是 伪 代 码 。 伪 代码 是 算法 所 需 的 一 种 类 似 英 语 的 代码 表示 形 
式 。 它 是 部 分 英语 和 部 分 结构 化 代码 的 组 合 。 英 文 代码 部 分 支持 宽松 的 语法 格式 ， 并 很 容易 
被 读 懂 。 代 码 部 分 包含 基本 算法 结构 的 扩充 版 本 : 顺序 、 选 择 和 循环 。 算 法 C.1 给 出 了 伪 代 
码 的 一 个 例子 。 我 们 简单 地 讨论 一 下 这 一 节 的 组 成 部 分 。 


组 成 部 分 
伪 代 码 中 的 算法 可 分 解 为 若干 元 素 和 结构 。 


C.1.1 算法 头 


每 种 算法 都 有 一 个 算法 头 来 命名 其 本 身 。 例 如 ,算法 C.1 的 算法 头 是 以 Algorithm 开 
始 ， 后 面 跟 算法 的 名 字 “FindingSmallest”。 


C.1.2 目的 、 条 件 和 返回 值 


定义 了 算法 头 之 后 ,一 般 情况 应 继续 写 出 目的 、 前 提 条 件 和 后 续 条 件 ， 以 及 此 算法 中 返 
回 的 数据 。 


算法 : C.1 伪 代 码 的 例子 
算法 : Findingsmallest (1ist) 
目的 : 这 个 算法 是 用 来 在 一 系列 数 中 找 最 小 值 
前 提 : 一 列 数字 
后 续 ; 无 
返回 : 数列 中 的 最 小 值 
{ 
smallest < first number 
loop ( not end of list) 
{ 
if (next number < smallest) 
{ 
smallest < second number 
} 
} 
return value of smallest 


} 

1. 目的 

目的 是 有 关 算 法 要 完成 什么 的 简短 语句 。 它 只 是 在 通常 的 算法 进程 中 被 描述 ， 并 非 所 有 
的 算法 进程 。 目 的 语句 以 Purpose 开始 ， 接 下 来 是 算法 目的 。 

2. 前 提 条 件 

前 提 条 件 列 出 了 算法 的 所 有 前 驱 需 求 。 例 如 ， 算 法 C.1 中 ， 我 们 需要 一 串 算法 可 用 的 
序列 。 
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3. 后 续 条 件 

后 续 条 件 指出 了 算法 产生 的 影响 。 例 如 ， 也 许 算法 会 指明 打印 数据 清单 。 

4. 返回 值 

我 们 认为 每 个 算法 应 该 指出 算法 返回 的 结果 。 如 果 没 有 要 返回 的 值 ， 则 要 指明 无 返回 
值 。 算 法 C.1 中 的 返回 值 为 序列 中 的 最 小 值 。 

5. 语句 

语句 是 像 算法 C.1 中 的 那些 赋值 、 输 入 、 输 出 、 条 件 和 循环 语句 。 肉 套 语句 (在 其 他 语 
句 中 的 语句 ) 是 缩 进 的 。 肉 套 语句 的 列表 是 以 开 括 号 ( 花 括 号 ) 开始 ， 以 闭 括号 结束 。 整 个 
参数 是 算法 自身 的 一 个 符 套 语句 列表 。 由 于 这 个 原因 ， 我 们 看 到 开始 处 有 一 个 开 括 号 ， 结 尾 
处 有 一 个 闭 括号 。 


C.1.3 语句 结构 


Niklaus Wirth 首次 提出 结构 编程 模型 时 ， 他 指出 任何 算法 都 仅 包含 三 种 程序 结构 : 顺 
序 、 选 择 和 循环 。 所 以 伪 代 码 也 只 包含 这 三 种 基本 结构 。 这 些 结构 的 实现 依赖 于 丰富 的 实现 
语言 。 例 如 ，C 语言 中 的 循环 可 能 会 用 while、do-while 或 for 来 实现 。 

1. 顺序 

算法 中 的 一 系列 顺序 语句 是 不 会 改变 执行 路 径 的 。 像 赋值 和 加 法 等 语句 显然 是 顺序 执行 
的 语句 ， 而 对 其 他 算法 的 调用 虽然 也 认为 是 顺序 语句 ， 但 却 不 是 显而易见 的 。 原 因 在 于 结构 
化 编程 的 定义 是 每 个 算法 仅 有 一 个 人 口 和 一 个 出 口 。 其 次 ， 当 算法 完成 时 ,会 立即 返回 到 原 
程序 继续 执行 。 因 此 你 可 以 认为 该 算法 调用 的 是 一 个 顺序 语句 ， 如 算法 C.2 所 示 。 


算法 C.2 顺序 的 例子 


x € first number 
Y second number 
zx X Y 

call Argument X 


2. 选择 

选择 语句 计算 一 个 或 多 个 选项 。 如 果 值 为 真 ， 则 选择 该 路 径 执 行 。 反 之 ， 选 择 另 外 的 路 
径 。 经 典 的 选择 语句 是 双 路 选择 (if-else)。 然 而 ， 多 数 的 语言 提供 多 路 选择 ， 伪 代码 中 却 不 
提供 。 选 择 分 支 用 缩 进 的 方式 标记 ， 如 算法 C.3 所 示 。 


算法 C.3 ”选择 的 例子 


If (x<y) 

{ 
Increment x 
Print x 

L 

Else 

{ 
Decrement y 
Print y 

} 


3. 循环 
循环 是 指 代 码 块 的 重复 执行 。 伪 代码 中 的 循环 类 似 while 循环 。 它 是 一 种 先 测试 循环 ; 
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也 就 是 说 ， 在 循环 主体 执行 前 先进 行 条 件 测 试 。 如 果 条 件 为 真 ， 则 执行 循环 ; 如 果 条 件 为 
假 ， 则 循环 中 断 。 算法 C.4 是 一 个 循环 的 例子 。 


算法 C.4 ”循环 的 例子 


Loop (more lines in the file Filel) 
{ 

Read next line 

Delete the leading space 

Copy the line to File2 
} 
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结 构 图 





结构 图 是 面向 过 程 软件 设计 阶段 的 主要 工具 。 作 为 一 个 设计 工具 ， 它 在 你 写 程 序 之 前 被 创建 。 
D.1 结构 图 符号 

图 D-1 中 给 出 了 结构 图 中 使 用 的 各 种 符号 。 
D.1.1 模块 符号 


结构 图 中 的 每 一 个 矩形 代表 编写 的 一 个 模块 。 和 矩形 的 名 字 就 是 它 所 代表 的 模块 的 名 字 。 
(图 D-2 )。 
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通用 模块 数据 流 “标记 流 
(+) 
异 或 循环 

图 D-1 结构 图 符号 图 D-2 结构 图 的 例子 


D.1.2 ”结构 图 中 的 选择 


图 D-3 给 出 了 两 个 被 选择 语句 所 调用 的 模块 符号 :条件 和 异 或 。 

图 D-3a 中 ,模块 A 包含 了 对 子 模块 fun 的 条 件 调用 ， 若 条 件 为 真 则 调用 fun ; 若 条 件 为 假 
则 跳 过 fun。 在 结构 图 中 这 种 情况 用 一 个 蓉 形 代表 ， 并 把 它 放 置 在 两 个 模块 间 的 同一 垂直 线 上 。 

图 D-3b 代表 在 两 个 模块 中 进行 选择 。 在 这 个 例子 中 ， 模 块 select 从 A 和 B 中 进行 选 
择 。 每 执行 一 次 select 有 且 仅 有 两 者 中 的 一 个 被 调用 。 这 就 是 我 们 所 熟知 的 异 或 : 两 个 待 选 
过 程 中 的 一 个 被 执行 而 另 一 个 不 执行 。 蜡 或 用 两 个 模块 之 间 的 “+” 号 表示 。 

现在 考虑 设计 从 多 个 模块 中 选择 调用 一 个 模块 。 这 发 生 在 根据 几 个 不 同 的 选择 条 件 调用 
不 同 模块 的 情况 。 图 D-4 包含 了 一 个 选择 语句 ， 它 根据 不 同 的 颜色 调用 不 同 的 模块 。 
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图 D-3 ”结构 图 中 的 选择 图 D-4 一 个 选择 的 例子 


党 
站 
图 


357 


D.1.3 ”结构 图 中 的 循环 


让 我 们 来 看 一 下 循环 是 如 何在 一 个 结构 图 中 表示 的 。 符 号 非常 简单 。 循 环 就 是 转圈 ， 因 
此 它 所 用 的 符号 是 圆圈 。 程 序 员 使 用 两 种 基本 的 循环 符号 ， 第 一 种 是 简单 循环 ， 如 图 :D-Sa 
所 示 。 另 一 种 是 条 件 循环 ， 如 图 D-5b 所 示 。 当 模块 被 无 条 件 调用 时 ， 如 在 while 循环 中 ， 
只 需 在 被 调用 函数 的 上 方 用 圆圈 住 直线 。 另 一 方面 ， 如 果 调 用 是 有 条 件 的 ， 如 在 if-else 语句 
循环 中 ， 则 在 圆 内 还 要 有 一 个 代表 条 件 的 葵 形 画 在 直线 上 。 

图 D-6 显示 模块 process 的 基本 结构 。 圆 位 于 控制 循环 模块 的 下 面 。 在 这 个 例子 中 ， 循 
环 语句 被 包含 在 process 中 ， 并 且 它 调用 三 个 模块 A、B 和 C。 循环 的 本 质 不 能 够 从 结构 图 
中 限定 ， 它 可 以 是 三 个 基本 循环 结构 中 的 任意 一 个 。 





a) 循环 b) 条 件 循环 
图 D-5 结构 图 中 的 循环 图 D-6 一 个 循环 的 例子 

D.2 阅读 结构 图 

结构 图 一 般 都 是 从 上 到 下 ， 从 左 到 右 阅 读 的 。 图 D-2 中 曾 提 过 ， 这 种 规则 说 明了 程序 
(main) 包含 三 个 子 模块 : initialize 、process 和 endOfJob。 按 照 从 左 到 右 的 规则 ， 首 先 被 程 
序 调用 的 为 initialize (初始 化 )。 初 始 化 完成 后 ， 调 用 process (函数 过 程 ) 。 当 函数 的 处 理 过 
程 结束 后 ， 函 数 调 用 endOfJob (收尾 工作 )。 换 名 话说 ， 某 些 结构 图 显示 的 函数 是 从 左 到 右 
调用 的 。 

从 上 到 下 的 概念 可 以 通过 process 来 说 明 。 当 process 被 调用 时 ， 它 轮流 调用 A、B、C， 
当 A 模块 结束 时 ,B 模块 还 没 开始 运行 。A 模块 在 运行 时 ， 它 将 轮流 调用 Al 和 A2。 换 言 之 ， 
在 B 模块 被 调用 前 ,在 A2 前 面 的 模块 都 已 经 被 调用 过 了 。 

通常 ， 程 序 要 完成 一 个 功能 都 要 调用 多 个 公有 模块 。 这 些 调用 在 程序 中 是 分 散 的 。 不 管 
这 些 调用 在 程序 中 的 逻辑 地 址 ， 在 结构 图 中 都 将 显示 这 些 调用 。 为 了 确认 公有 的 结构 ， 和 矩形 
块 的 右 下 角 将 包括 双向 影 线 或 画 一 块 阴 影 。 假 如 公有 模块 很 复杂 且 包 括 子 模块 ， 这 些 子 模块 
只 能 被 显示 一 次 。 如 果 要 表示 某 参 数 还 没完 成 ， 还 需要 增加 结构 ， 那 么 一 般 都 在 该 矩形 下 面 
加 上 “一 ”符号 。 这 个 概念 如 图 D-7 所 示 ， 如 在 该 程序 的 不 同 地 方 都 用 到 了 一 个 公有 模块 
average。 注 意 ， 你 不 可 能 图 形 化 显示 一 个 与 两 个 子 模块 相连 的 模块 。 






图 D-7 同一 模块 的 一 些 调用 
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D.3 ”结构 图 规则 


我 们 在 本 章 中 总 结 了 几 个 规则 : 

e 结构 图 中 的 每 个 矩形 都 代表 了 一 个 模块 。 

和 矩形 中 的 名 字 就 是 模块 代码 中 的 模块 名 。 

结构 图 中 只 包含 模块 流程 ， 没 有 任何 代码 。 

公有 模块 的 矩形 一 般 都 在 右 下 角 画 一 条 双向 影 线 或 一 块 阴影 。 
数据 流 和 标志 是 可 选 的 ， 但 如 果 使 用 ， 则 必须 命名 。 

。 输入 流 和 标志 显示 在 垂直 线 的 左 端 ， 输 出 流 和 标志 显示 在 其 右 端 。 
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Foundations of Computer Science, Third Edition 


”布尔 代数 和 逻辑 电路 





E.1 布尔 代数 


布尔 代数 处 理 只 有 0 或 1 两 种 值 的 变量 和 和 常量。 这 种 代数 适合 表示 计算 机 中 的 信息 ， 该 
计算 机 是 由 只 有 开 和 关 两 种 状态 的 信号 集合 而 成 的 。 


E.1.1 常量 、 变 量 和 运算 符 
在 布尔 代数 中 我 们 使 用 常量 、 变 量 和 运算 符 。 


1. 常 量 

只 有 两 个 常量 1 和 0，1 相当 于 逻辑 真 ; 0 相当 于 逻辑 假 。 

2. 变量 

使 用 字母 (如 x、y 和 z) 代表 变量 ， 布 尔 变 量 只 能 取 值 0 或 1。 
3. 运算 符 


我 们 使 用 三 个 基本 的 运算 符 : NOT、AND 和 OR。 使 用 单 引 号 表示 NOT ; 使 用 一 小 点 
表示 AND; 使 用 “+” 号 表示 OR， 如 下 所 示 : 

X'" 一 NOT x X"Y 一 X AND Y 2 YX OR Y 

运算 符 带 一 个 或 两 个 值 ， 产 生 一 个 输出 值 。 第 一 个 运算 符 NOT 是 一 个 一 元 运算 符 ， 只 
带 一 个 值 ; 另外 两 个 (AND 和 OR) 是 二 元 运算 符 ， 带 两 个 值 。 注 意 : 运算 符 的 选择 是 任意 
的 ， 我 们 可 以 通过 NAND (后 面 解释 ) 构建 所 有 的 门 电路 。 


E.1.2 ”表达 式 
一 个 表达 式 是 布尔 运算 符 、 常 量 和 变量 的 组 合 。 下 面 的 是 布尔 表达 式 : 


0 x 过 X+0 
xX+1+y x. (y+2z) Xx+y+z XY t 


E.1.3 ”逻辑 门 


逻辑 门 是 一 种 电子 设备 ， 它 通常 有 1 ~ N 个 输入 ， 产 生 一 个 输出 。 但 是 ， 在 本 附录 中 ， 
为 简化 起 见 ， 我 们 使 用 只 带 一 个 或 两 个 输入 的 门 。 输 出 的 逻辑 值 由 表示 门 的 表达 式 和 输入 值 
决定 。 各 种 各 样 的 逻辑 门 被 广泛 地 应 用 于 数字 计算 机 中 。 图 E-1 显示 了 8 种 最 常见 的 门 的 符 
号 、 真 值 表 ( 见 第 4 章 ) 和 表达 式 ， 该 表达 式 在 给 定 输入 时 ， 能 给 出 输出 。 
e 缓冲 器 ”第 一 个 门 仅仅 是 一 个 缓冲 器 ， 其 中 输入 和 输出 是 相同 的 。 如 果 输 入 是 0， 输 
出 也 是 0; 如 果 输 入 是 1， 输 出 也 是 1。 缓 冲 器 只 是 放大 了 输入 信号 。 
e NOT NOT 门 是 NOT 运算 符 的 实现 。 这 个 门 的 输出 是 输入 的 相反 值 。 如 果 输 入 是 
1， 输 出 就 是 0; 如 果 输 入 是 0， 输 出 就 是 1。 
e AND AND 门 是 AND 运算 符 的 实现 。 它 带 两 个 输入 ， 产 生 一 个 输出 。 如 果 两 个 输 
人 都 是 1 时 ， 输 出 才 是 1; 否则 ， 输 出 就 是 0。 有 时 AND 运算 符 称 为 乘积 。 
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图 E-1 常用 门 的 符号 和 真 值 表 


e。 OR OR 门 是 OR 运算 符 的 实现 。 它 带 两 个 输入 ， 产 生 一 个 输出 。 如 果 任 一 个 输入 
或 两 个 输入 为 1， 输 出 就 是 1， 否 则 ， 输 出 就 是 0。 有 时 OR 门 称 为 加 。 
NAND NAND 门 是 一 个 AND 门 跟 一 个 NOT 门 的 逻辑 组 合 。 当 我 们 讨论 这 些 门 的 
实际 实现 时 ， 我 们 将 给 出 这 个 门 存在 的 原因 。 当 两 个 门 的 输入 相同 时 ，NAND 门 的 
输出 与 相应 AND 门 相反 。 
NOR NOR 门 是 一 个 OR 门 跟 一 个 NOT 门 的 逻辑 组 合 。 当 我 们 讨论 这 些 门 的 实际 
实现 时 ， 我 们 将 给 出 这 个 门 存在 的 原因 。 当 两 个 门 的 输入 相同 时 ，NOR 门 的 输出 与 
相应 OR 门 相反 。 
XOR XOR ( 异 或 ) 门 由 表达 式 (x.y'+x'.y) 定义 ， 它 通常 表示 成 (x 外 y)。 当 两 个 
输入 不 同时 ,输出 为 1 ; 输入 相同 时 ， 输 出 为 0。 也 可 以 说 这 是 一 个 更 多 限制 的 OR 
门 。 除 了 两 个 输入 为 1， 输 出 为 0 的 情况 ，XOR 门 的 输出 与 OR 门 相 同 。 
XNOR XNOR 门 由 表达 式 (x . y’ + x'.y) 定义 ， 它 通常 被 表示 成 (x 四 7) '。 它 与 
XOR 门 相 反 。 当 两 个 输入 相同 时 ， 输 出 为 1 ; 输入 不 同时 ， 输 出 为 0。 也 可 以 说 这 
表示 了 逻辑 意义 上 的 等 价 : 只 有 两 个 输入 相等 时 ， 输 出 才 为 1。 

门 的 实现 

前 一 节 中 讨论 的 钦 辑 门 在 物理 上 都 可 以 用 电子 开关 (晶体管 ) 来 实现 。 最 通常 的 实现 指 
使 用 三 个 门 : NOT、NAND 和 NOR。NAND 门 比 AND 门 使 用 更 少 的 部 件 。 这 对 NOR 门 和 
OR 门 也 是 同样 的 。 所 以 ，NAND 门 和 NOR 门 成 为 了 工业 中 的 通用 标准 。 我 们 这 里 只 讨论 
这 三 个 门 的 实现 。 虽 然 在 这 里 要 简单 提 一 下 开关 ,但 开关 在 实际 应 用 过 程 中 是 被 晶体 管 蔡 代 
的 。 门 电路 中 使 用 的 晶体 管 行为 就 像 一 个 开关 。 当 给 开关 施 以 合适 的 输入 电压 时 ， 开 关 可 以 
打开 或 关闭 。 有 多 种 技术 来 实现 这 些 唱 体 管 。 但 是 我 们 把 实现 晶体 管 的 讨论 留 给 电子 方面 的 
书籍 。 
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( 1) NOT 门 的 实现 
NOT 门 可 以 用 电子 开关 、 电 压 源 和 电阻 器 来 实现 ， 如 图 E-2 所 示 。 
正 电压 
(V 伏 ) 
x x 
加 
要 b) 符号 
x'( 输 出 ) NOT 
x (输入) 开关 1 
1 0 
三 地 (0 电压 ) 9 表 
a) 实现 


图 E-2 NOT 门 的 实现 


门 的 输入 是 一 个 掌控 开关 打开 和 关闭 的 控制 信号 。 一 个 为 0 的 输入 信号 使 开关 打开 ， 而 
为 1 的 输入 信号 使 开关 关闭 。 输 出 是 开关 前 的 一 点 上 的 电压 输出 接线 端 )。 如 果 这 点 电压 
值 是 正 的 (V 伏 )， 输 出 就 被 解释 成 1 ; 如 果 电 压 是 0 (或 低 于 一 个 浆 值 )， 输 出 就 被 解释 成 
0。 当 开关 是 打开 的 ， 没 有 电流 通过 电阻 器 ， 因 此 没有 电压 的 下 降 ， 输 出 电压 就 是 V (解释 
成 1 )。 合 上 开关 ， 输 出 接线 端 就 与 地 相连 ， 电 压 就 为 0 或 几乎 为 0 )， 这 就 被 解释 为 逻辑 0。 
注意 : hth Let 





(2) NAND 门 的 实现 

NAND 门 可 以 用 串联 的 两 个 开关 (两 个 输入 ) 来 实现 。 为 了 使 得 电流 能 通过 电路 从 正极 流向 
地 ， 两 个 开关 都 必须 合 上 ( 即 两 个 输入 必须 是 1 )， 在 这 种 情况 下 ， 因 为 输出 接线 端 与 地 (逻辑 
0 ) 相连 ， 所 以 输出 接线 端的 电压 是 0。 如 果 一 个 开关 或 两 个 开关 是 打开 的 ( 即 输入 是 00、01 或 
10 )， 没 有 电流 通过 电阻 器 ， 通 过 电阻 器 的 电压 没有 下 降 ， 输 出 接线 端的 电压 就 是 V (逻辑 1 )。 

EE-3 显示 了 NAND 门 的 实现 ， 电 路 的 表现 与 表 中 显示 的 值 匹 配 。 注 意 : 如 果 需 要 一 
个 AND 门 ， eh ied NAND aa NOT 门 来 实现 。 





三 地 (0 电压 ) 
a) 实现 
图 E-3 NAND 门 的 实现 
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(3 ) NOR 门 的 实现 

NOR 门 可 以 用 并 联 (两 个 输入 ) 的 两 个 开关 来 实现 ， 如 果 两 个 开关 都 打开 ， 那 么 电流 就 
不 流 过 电阻 器 ， 在 这 种 情况 下 ， 通 过 电阻 器 的 电压 没有 下 降 ， 这 就 意味 着 输出 接线 端 持 有 电 
压 V (逻辑 1 )。 如 果 有 一 个 开关 或 两 个 开关 合 上 了 ， 输 出 接线 端 就 与 地 相连 ， 输 出 电压 为 0 
(逻辑 0 )。 

图 E-4 显示 了 NOR 门 的 实现 ， 电 路 的 表现 与 表 中 显示 的 值 匹 配 。 注 意 : 如 果 需 要 一 个 
OR 门 ， 可 以 通过 一 个 NOR 门 和 一 个 NOT 门 来 实现 。 





三 地 (0 电压 ) 
a) 实现 


图 E-4 NOR 门 的 实现 











E.1.4” 公理、 定理 和 恒等式 
为 了 研究 布尔 代数 ， 我 们 需要 一 些 规则 。 在 布尔 代数 中 这 些 规则 可 以 分 成 三 大 类 : 公 
理 、 定 理 和 恒等式 。 
1. 公理 
布尔 代数 像 其 他 代数 一 样 使 用 一 些 规则 ， 称 为 公理 ， 它 们 不 需要 证 明 。 表 E-1 显示 了 布 
尔 代数 中 的 公理 。 
表 E-1 布尔 代数 的 公理 


1+1=1 





1+0=0+1=1 


2. 定理 
定理 是 我 们 用 公理 证 明 的 规则 ， 虽 然 我 们 必须 把 这 些 证 明 留 给 专门 介绍 布尔 代数 的 书 。 
表 E-2 显示 了 布尔 代数 中 的 部 分 定理 。 


布 仙 代数 和 永 帮 电路 363 


表 E-2 布尔 代数 的 基本 定理 





3. 恒等式 
使 用 公理 和 定理 ,我 们 可 以 推导 出 许多 恒等式 。 在 表 E-3 中 ,我 们 只 列 出 了 最 常用 的 ， 
我 们 把 这 些 证 明 留 给 专门 介绍 布尔 代数 的 书 。 
表 E-3 与 OR 和 AND 运算 符 相 关 的 基本 的 恒等式 


| om rnin | 


















XxX+(y+2z)=(x+y)+2z 





XxX+(y* 2z)=(x+y)"* (x+2) 
| 
德 . 摩根 律 在 逻辑 设计 中 起 到 非常 重要 的 作用 ， 正 像 我 们 马上 要 看 到 的 一 样 。 它 们 可 以 
推广 到 多 个 变量 ， 例 如 ， 对 于 三 个 变量 有 如 下 的 两 个 恒等式 : 


(x+Yy+Z) "= x’*y'*z’ (X。，Y，Z) '=X'+Y'+Z/ 





X+(x :y=x+y 


E.1.5 布尔 函数 
我 们 把 布尔 函数 定义 为 : 一 个 具有 个 布尔 输入 变量 和 一 个 布尔 输出 变量 的 函数 ， 如 


图 E-5 所 示 。 

函数 可 以 用 真 值 表 来 表示 ， 也 可 以 用 表达 式 来 表示 。 ,个 输入 
一 个 函数 的 真 值 表 有 2" 行 和 n+ 1 列 。 前 面 n 列 定义 了 : 
变量 的 可 能 的 值 ， 最 后 一 列 定义 了 函数 的 输出 值 ， 它 是 pe pe 
前 面 列 值 的 组 合 。 

图 E-6 显示 了 Fl 和 两 个 函数 的 真 值 表 和 表达 式 表示 。 虽 然 真 值 表 是 唯一 的 ， 但 函数 
可 以 用 不 同 的 表达 式 表示 。 我 们 为 每 个 函数 显示 了 两 个 表达 式 。 注 意 : 第 二 个 表达 式 要 简短 
些 。 后 面 将 介绍 为 了 提高 实现 的 效率 ， 需 要 简化 表达 式 。 

真 值 表 到 表达 式 的 转换 

函数 的 说 明 一 般 是 给 一 个 真 值 表 (参见 第 4 章 )。 为 了 用 逻辑 门 〈 前 面 刚 介 绍 过 ) 实现 函 
数 ， 我 们 需要 找到 真 值 表 对 应 的 表达 式 。 有 两 种 方法 可 以 采用 。 

(1) 积 之 和 

第 一 种 把 真 值 表 转 化 成 表达 式 的 方法 称 为 积 之 和 。 一 个 函数 的 积 之 和 表示 是 由 多 达 2" 个 
项 组 成 ， 其 中 每 个 项 称 为 最 小 项 。 最 小 项 是 函数 中 所 有 变量 的 乘积 (AND 运算 )， 其 中 每 个 变 
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量 只 出 现 一 次 。 例 如 ， 在 三 个 变量 的 函数 中 ， 有 8 个 最 小 项 ， 如 : 六 .包子 或 xz 每 
一 项 代表 真 值 表 中 的 一 行 。 如 果 变 量 的 值 是 0， 变量 的 补 就 出 现在 项 中 ; 如 果 变 量 的 值 是 1， 
变量 本 身 就 出 现在 项 中 。 为 了 把 真 值 表 转 换 成 积 之 和 表示 ， 我 们 使 用 如 下 策略 : 


FI=x'.y'+x.y'+x.y F,=x".y".2+x".y.2+X.y".2+x.y.2 
F,=x+y" F,=x.2+x'.2" 





F, 的 真 值 表 


图 E-6 真 值 表 到 表达 式 转化 的 例子 


1 ) 找 出 函数 值 为 1 的 行 对 应 的 最 小 项 ; 

2 ) 对 第 1 ) 步 中 的 项 求 和 (OR 运算 )。 

(2 ) 和 之 积 

第 二 种 把 真 值 表 转 化 成 表达 式 的 方法 称 为 和 之 积 。 一 个 函数 的 和 之 积 表示 是 由 多 达 2” 
个 项 组 成 ， 其 中 每 个 项 称 为 最 大 项 。 最 大 项 是 函数 中 所 有 变量 的 和 ( OR 运算 )， 其 中 每 个 变 
量 只 出 现 一 次 。 例 如 ， 在 三 个 变量 的 函数 中 ， 有 8 个 最 大 项 ， 如 : x*+y +z' 或 xX+y'+z'。 
为 了 把 真 值 表 转 换 成 和 之 积 表示 ， 我 们 使 用 如 下 策略 : 

1 ) 找 出 函数 值 为 0 的 行 对 应 的 最 小 项 ; 

2 ) 对 第 1 步 中 的 项 求 和 ， 并 求 补 ; 

3 ) 使 用 德 ， 摩根 律 ， 把 最 小 项 改 成 最 大 项 。 

例 E.1 图 E-7 显示 了 如 何 建立 图 E-6 中 的 函数 Fl 和 丈 的 积 之 和 与 和 之 积 。 

积 之 和 直接 由 真 值 表 而 得 ， 但 和 之 积 需要 使 用 德 ， 摩根 律 。 注 意 : 有 时 是 第 一 种 方法 给 
出 较 短 的 表达 式 ， 有 时 是 第 二 种 方法 给 出 较 短 的 表达 式 。 


F=(x".y)' =(x+y") 


: 


一 呈 一 呈 一 己 一 己 | 机 


积 之 和 
FS=X.y".2 +X.y.2 +x.y'.Z+X.y.2 
和 之 积 





FS=(x".y".2+x".y.2+x.y".2+x.y.2")" 


=(X".y'.2)". (xX.p.2)". (x.y'.2")". (x.y.2")" 
=(x+y+2")". (x'+y'+2z"). (x'+yt+z). (x'+y'+z) 


0 
0 
0 
0 
1 
1 
1 
1 





图 E-7 例 E.! 
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E.1.6 ”函数 简化 


虽然 我 们 可 以 使 用 前 面 介绍 过 的 逻辑 门 来 实现 布尔 函数 ， 但 通常 效率 低下 。 函 数 的 直接 
实现 需要 更 多 的 门 。 如 果 化 简 ， 门 的 数目 就 可 以 减少 。 通 常 有 两 种 简化 方法 : 用 卡 诺 图 的 代 
数 方法 和 Quine-McKluskey 方法 。 

1. 代数 方法 

我 们 可 以 使 用 前 面 讨 论 过 的 公理 、 定 理 和 恒等式 来 化 简 函 数 。 例 如 ， 可 以 化 简 图 E-7 中 
的 第 一 个 函数 (Fr )， 如 下 所 示 : 

FI = x *y +xX*y+x*y 


= (x'+XxX) "y+x*y 关于 AND 的 恒等式 3 (分 配 律 ) 
= 1°*y+x*y 关于 OR 的 定理 5 

= y+x*y 关于 AND 的 定理 3 

= y+y*x 关于 AND 的 定理 1 (交换 律 ) 
= y'+x 恒等式 5 (吸收 律 ) 

= x+y 关于 OR 的 定理 1 (交换 律 ) 


这 就 意味 着 未 化 简 的 表达 式 需要 8 个 门 ， 而 化 简 过 的 只 需要 两 门 : 一 个 NOT 和 一 
个 OR。 

2. 卡 诺 图 方法 

另外 一 个 化 简 的 方法 涉及 卡 诺 图 的 使 用 。 这 种 方法 通常 是 被 4 个 以 上 变量 的 函数 使 用 
的 。 图 是 一 个 具有 2” 个 单元 格 的 和 矩阵， 每 个 单元 格 代表 函数 的 一 个 值 。 要 关注 的 第 一 点 是 
正确 地 填写 图 。 与 通常 的 一 行 接 一 行 或 一 列 接 一 列 地 填写 方法 不 同 ， 它 是 根据 图 中 显示 的 变 
量 的 值 来 填写 的 。 图 E-8 显示 了 一 个 n=2，3 或 4 的 例子 。 

在 真 值 表 中 ， 我们 从 真 值 表 的 顶部 到 底部 去 使 用 函数 的 值 。 图 是 一 行 接 一 行 地 被 填写 
的 ,但 行 的 顺序 是 1, 2, 4, 3。 在 每 一 列 中 ， 列 也 是 一 个 接 一 个 被 填写 的 ， 但 列 的 顺序 是 1， 
2，4，3。 第 4 行 在 第 3 行 的 前 面 ; 第 4 列 在 第 3 列 的 前 面 。 这 样 的 安排 是 最 大 程度 地 化 简 
的 需要 。 








CE 
0 0 0 0 1 

0 0 0 1 1 

0 0 1 0 1 

001 1 0 

F, 的 图 0 10 0 辆 

0 1 0 1 0 

0 1 1 0 1 

[x y z|F,| 0 1 1 1 km 
0 0 1 0 0 0 0 

0 1 1 00 1 0 

1 0 1 0 1 0 0 

1 1 1 0 1 1 1 

0 0 1 1 0 0 0 

0 1 1 1 0 1 0 

1 0 F, 的 图 1 11 0 辆 

1 1 时 和 和 0 
F., 的 真 值 表 F, 的 真 值 表 


图 E-8 卡 诺 图 的 建造 
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(1 ) 积 之 和 
化 简 可 以 通过 建立 积 之 和 来 进行 ， 当 采用 这 种 方法 化 简 函 数 时 ， 使 用 值 为 1 的 最 小 项 。 
为 了 得 到 高 效 的 表达 式 ， 首 先 合并 相 邻 的 最 小 项 。 注 意 : 相 邻 也 包含 位 的 环绕 。 


例 E-2 图 E-9 显示 了 我 们 的 第 一 个 
函数 使 用 积 之 和 的 化 简 。 第 二 行 中 的 1 包 ”站 二 可 
含 了 整个 x 的 域 。 第 一 列 中 的 1 包含 了 整个 [| 了 | 一 zx[ of 


y' 的 域 。 得 出 的 化 简 函 数 是 Fl= (x) + (y')。 F 的 图 i A 
图 中 还 显示 了 用 一 个 OR 门 和 一 个 NOT 门 和 
的 实现 。 一 区 区- 一 -aio0" 

例 E.3 图 E-10 显示 了 第 二 个 函数 使 图 E-9 例 E2 
用 积 之 和 的 化 简 。 第 二 行 的 1 是 x 域 和 z 
域 的 交集 ， 它 用 (x. z) 来 表示 。 第 一 行 的 1 是 x' 和 z' 域 的 交集 ， 它 用 (x'* z') 来 表示 。 得 
出 的 化 简 函 数 是 丈 = (x: z) + (x': z")。 图 中 还 显示 了 使 用 一 个 OR 门 、 两 个 AND 门 和 两 个 
NOT 门 的 实现 。 





F,=(x.z)+(x'.z") 

x 

了 

下 F,=(e D +(x".2) 


图 E-10 例 E.3 
(2 ) 和 之 积 
化 简 可 以 通过 使 用 和 之 积 的 方法 来 进行 ， 当 采用 这 种 方法 化 简 函 数 时 ， 使 用 最 大 项 。 为 
了 得 到 高 效 的 表达 式 ， 首 先 合并 相 邻 的 最 
最 小 项 。 但 是 ， 用 这 种 方法 得 到 的 函数 | 


(F)'=(x".y) 





nr ora ds i 


用 德 * 摩根 律 找到 函数 。 


例 E.4 图 E-1l 显示 了 第 一 个 函数 (FE)=E) = =Ge+y") 
使 用 和 之 积 的 化 简 。 注 意 ; 在 此 情况 下 ， 。 i , 
实现 与 图 B2 中 的 相同 ， 但 不 经 党 是 这 7 一 萝 一 区 一 5 
样 的 。 还 要 注意 : 函数 只 有 一 个 项 ， 不 i 
需要 AND 门 。 


例 E.5 图 E-12 显示 了 第 二 个 函数 使 用 和 之 积 的 化 简 。 注 意 : 过 程 给 出 (F,)， 所 以 
我 们 需要 使 用 德 . 摩根 律 找到 FF,。 图 中 还 显示 了 使 用 两 个 NOT 门 、 两 个 OR 门 和 一 个 
AND 门 的 实现 。 这 个 实现 比 我 们 使 用 最 小 项 得 到 的 那个 效率 要 低 。 我 们 总 是 采用 高 效 的 
实现 。 
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z 
F, 的 图 (F,)'=(x'.z) + (x.2z") 
F,= [(F,)']= [(x".z2)+(x.z)]'= (x'.2)".(x.2')'= (x+z").(x'+z) 
x 
F,=(x+2z"). (x'+2z) 
z 
图 E-12 例 E.5 


E.2 逻辑 电路 

计算 机 通常 是 由 称 为 逻辑 电路 的 标准 构件 建造 而 成 的 。 逻 辑 电 路 分 成 两 大 类 : 组 合 电路 
和 时 序 电 路 。 我 们 将 简单 地 讨论 每 一 类 ， 并 给 出 一 些 例子 。 
E.2.1 组 合 电路 


组 合 电路 是 由 带 有 个 输入 和 nm 个 输出 的 逻辑 门 组 成 的 电路 。 任 何 时 刻 每 个 输出 完全 
信 术 二 所 有 给 定 的 输入。 





人 ， i 刻 每 个 输出 完全 依赖 于 所 有 给 定 的 输入 。 

图 E-13 显示 了 具有 个 输入 和 m 个 输出 的 组 合 电路 的 块 图 。 比 较 图 E-13 和 图 E-5， 我 
们 可 以 说 一 个 带 有 m 个 输出 的 组 合 电路 可 以 看 成 mn 个 函数 ， 每 个 输出 对 应 一 个 函数 。 

组 合 电路 的 输出 通常 是 由 真 值 表 来 定义 的 ， 只 是 真 值 表 需 要 有 m 个 输出 。 

1. 半 加 法 器 

一 个 简单 的 组 合 电路 的 例子 是 半 加 法 器 ， 这 个 加 法 器 只 能 做 两 个 二 进 制 位 的 加 法 。 半 加 
法 器 是 具有 两 个 输入 和 两 个 输出 的 组 合 电路 。 两 个 输入 定义 了 要 进行 加 法 的 两 个 二 进 制 位 ， 
第 一 个 输出 是 两 个 二 进 制 位 的 和 ， 而 第 二 个 输出 是 要 传 给 下 一 个 加 法 器 的 进位 。 图 E-14 显 
示 了 一 个 半 加 法 器 ， 并 显示 了 它 的 真 值 表 和 生成 电路 所 用 的 逻辑 门 。 








a) 组 合 电路 
图 E-13 一 个 组 合 电路 图 E-14 半 加 法 器 


两 个 二 进 制 位 的 和 可 以 使 用 XOR 门 得 到 ; 进位 可 以 使 用 AND 门 得 到 。 

2. 多 路 复 用 器 

多 路 复 用 器 是 一 个 带 有 nn 个 输入 和 只 有 一 个 输出 的 组 合 电 路 。n 个 输入 由 数据 输入 D 和 
控制 输入 C 组 成 (n=D + C)。 在 任何 时 刻 ， 多 路 复 用 器 只 选择 数据 输入 DD 中 的 一 个 发 送 到 
唯一 的 数据 输出 ， 而 这 个 选择 是 由 控制 位 的 值 来 决定 的 。 为 了 选择 数据 输入 DD 中 的 一 个 ， 
需要 C=log2D 的 控制 位 。 如 果 D=2， 在 任何 时 刻 只 有 一 个 数据 输入 发 送 到 输出 ， 控 制 输入 
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只 是 一 位 。 如 果 控 制 输入 为 0， 则 第 一 个 数据 输入 直接 到 输出 ; 如 果 控 制 输入 为 1， 则 第 二 
个 数据 输入 被 发 送 到 输出 。 

图 E-15 显示 了 真 值 表 和 2X1 多 路 复 用 器 的 电路 。 注 意 : 电路 实际 上 有 三 个 输入 和 一 个 
输出 ， 控 制 输 入 被 看 成 是 一 个 输入 。 

注意 : 这 里 的 真 值 表 非 常 简化 ， 输 出 依赖 于 控制 输入 ， 但 输出 的 值 却 是 两 个 输入 中 的 一 个 。 


C D,: 第 一 个 输入 CC: 控制 
D,: 第 二 个 输入 0: 输出 





a) 组 合 电路 b) 真 值 表 
图 E-15 多 路 复 用 器 


E.2.2 时序 电路 


组 合 电路 是 没有 记忆 的 ， 它 不 能 记 住 它 以 前 的 输出 ， 在 任何 时 刻 输出 仅仅 依赖 于 当前 
的 输入 。 而 时 序 电 路 包含 了 逻辑 上 的 记忆 概念 ， 记 忆 使 得 电路 能 记 住 当前 状态 ， 以 便 将 来 使 
用 ， 将 来 的 状态 可 以 依赖 于 当前 状态 。 

1. 双 稳 态 多 谐振 荡 器 

为 了 把 记忆 的 想法 添加 到 组 合 电路 中 ， 发 明了 称 为 双 稳 态 多 谐振 荡 器 的 存储 单元 ， 该 存 
储 单元 能 保存 一 位 信息 。 一 组 双 稳 态 多 谐振 荡 器 可 以 用 来 保存 一 组 二 进 制 位 。 

(1 ) SR 双 稳 态 多 谐振 荡 器 

最 简单 的 双 稳 态 多 谐振 荡 是 SR 双 稳 态 多 谐振 荡 器 ， 其 中 有 两 个 输入 8 (设置 ) 和 R ( 重 
置 ) 以 及 两 个 输出 CO 和 C'， 它 们 总 是 互相 相反 的 。 图 E-16 显示 了 一 个 SR 双 稳 态 多 谐振 荡 
的 符号 、 电 路 和 特征 表 。 注 意 : 特征 表 和 我 们 在 组 合 电 路 中 的 真 值 表 是 不 同 的 。 特 征 表 显示 
了 下 一 个 输出 Q(t + 1), 输出 Q(t+ 1) 是 基于 当前 输出 C(D 和 输入 的 。 


一 sR ony 
9- 6 
a) 符号 b) 电路 





图 E-16 SR 双 稳 态 多 谐振 荡 器 


特征 表 显 示 出 : 如 果 S 和 RR 都 为 0， 输 出 Q(t + D=2GD， 也 就 是 下 一 个 输出 和 当前 输出 
相同 ; 如 果 5S 为 0，R 为 1， 输出 Q(t1+ 1)=0， 这 意味 着 输出 将 被 重 置 (R=1 ) ; 如 果 8 为 1， 
RR 为 0， 输出 Q(t + 1)=1， 这 意味 着 输出 将 被 设置 。 但 是 ， 如 果 S 和 RR 都 为 1， 下 一 个 输出 
是 不 可 预测 的 (无 定义 )。 注 意 ; 在 特征 表 中 我 们 并 没有 显示 0' 的 值 ， 因 为 它 总 是 与 2 值 相 
反 的 。 

一 个 SR 双 稳 态 多 谐振 荡 器 可 以 被 用 作 设 置 - 重 设 设备 。 例 如 ， 如 果 输 出 是 连 到 一 个 电 
气 音响 器 上 的 ， 警 报 可 以 通过 让 R=0 和 5S=1 来 设置 设置 后 ， 警 报 会 一 直 响 ， 直 到 它 被 用 
R=1 和 S$S=0 来 重 置 。 这 个 设计 的 唯一 缺陷 是 R 和 5 不 应 该 同时 为 1。 
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为 了 理解 SR 双 稳 态 多 谐振 荡 器 的 原理 ， 需 要 创建 它 的 真 值 表 。 但 需要 注意 ,我 们 有 3 
个 输入 和 1 个 输出 (OQ 和 0' 是 独立 的 )。 表 E-4 SR 双 稳 态 多 谐振 荡 器 真 值 表 
表 E-4 是 该 振荡 器 的 真 值 表 。 

(2 ) D 双 稳 态 多 谐振 荡 器 

SR 双 稳 态 多 谐振 荡 器 不 能 当 作 1 位 存 
储 器 来 使 用 ， 因 为 它 需 要 两 个 输入 ， 而 不 是 
一 个 。 对 SR 双 稳 态 多 谐振 荡 器 的 一 个 小 的 
修改 就 能 建立 一 个 D 双 稳 态 多 谐振 荡 器 ( D 
代表 数据 )。 图 E-17 显示 一 个 DD 双 稳 态 多 
谐振 荡 器 的 符号 和 特征 。 

注意 : 虽然 D 双 稳 态 多 谐振 荡 器 的 输 
出 与 它 的 输入 相同 ， 但 是 输出 是 一 直 保持 
的 ， 直 到 给 出 新 的 输入 。 这 意味 着 它 能 记忆 
它 的 输入 状态 。 


Q | D | Q(t+1) | 
D 0 
Q 于 1 


a) 符号 b) 电路 c) 特征 表 
图 E-17 DD 双 稳 态 多 谐振 功 器 


(3 ) JK 双 稳 态 多 谐振 荡 器 

为 了 把 未 定义 状态 从 SR 双 稳 态 多 谐振 荡 器 中 移 去 ，JK 双 稳 态 多 谐振 荡 器 就 被 发 明了 
(JK 代表 Jack Kilby， 他 发 明了 集成 电路 )。 增 加 两 个 AND 门 到 SR 双 稳 态 多 谐振 荡 器 中 就 
形成 了 JK 双 稳 态 多 谐振 荡 器 ， 它 没有 未 定义 的 状态 。 图 E-18 显示 了 JK 双 稳 态 多 谐振 荡 器 
和 它 的 特征 表 。 








b) 电路 
图 E-18 JK 双 稳 态 多 谐振 荡 器 


(4) 工 双 稳 态 多 谐振 范 器 

另外 一 个 通用 的 双 稳 态 多 谐振 功 器 是 T 双 稳 态 多 谐振 荡 器 (T 代表 拔 动 开关 ( toggle))， 
这 种 双 稳 态 多 谐振 荡 器 通过 把 JK 双 稳 态 多 谐振 荡 器 的 两 个 输入 合 在 一 起 ( 称 为 输入 ) 而 
制 成 。 这 个 输入 拨 动 双 稳 态 多 谐振 荡 器 的 状态 : 如 果 输 入 为 0， 下 一 个 状态 跟 当前 状态 相同 ; 
如 果 输 入 为 1， 下 一 个 状态 与 当前 状态 相反 。 图 E-19 显示 了 TT 双 稳 态 多 谐振 荡 器 的 符号 、 
电路 和 特征 表 。 
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0 We 
， 1 Q'(bD) 
a) 符号 c) 特征 表 
图 E-19 TT 双 稳 态 多 谐振 荡 器 
2. 同步 与 异步 


到 目前 为 止 我们 讨论 的 双 稳 态 多 谐振 荡 器 都 被 称 为 异步 设备 : 一 个 状态 到 男 一 个 状态 
的 转换 只 有 当 输 入 改变 之 后 才 会 发 生 。 数 字 计 算 机 却 是 同步 设备 ,计算 机 中 的 中 央 时 钟 控制 
了 所 有 逻辑 电路 的 调度 。 时 钟 建立 了 一 个 信号 (具有 相等 脉 宽 的 一 系列 脉冲 ) 来 调整 所 有 的 
事件 。 一 个 简单 的 事件 只 占据 这 个 时 钟 信 号 的 一 个 “滴答 声 ” (tick)。 

图 E-20 显示 了 一 个 时 钟 的 抽象 概念 。 我 们 称 它 为 抽象 (abstract)， 是 因为 在 现实 中 ， 没 
有 电路 能 产生 一 个 完全 光滑 的 脉冲 信号 ， 但 这 里 显示 的 信号 对 于 我 们 的 讨论 是 足够 的 。 


电压 


0 时 间 


图 E-20 ”时钟 脉 冲 


如 果 我 们 给 电路 增加 一 个 输入 ， 一 个 双 稳 态 多 谐振 荡 器 就 可 以 是 同步 的 ， 这 个 输入 就 是 
时 钟 输入 。 时 钟 输入 可 以 与 每 个 输入 进行 AND (与 ) 运算 ， 从 而 选 通 输入 ， 所 以 只 有 当 有 时 
钟 脉冲 时 ， 它 才 有 效 。 图 E-21 显示 了 我 们 所 讨论 的 所 有 4 种 双 稳 态 多 谐振 功 器 的 时 钟 版 本 
的 符号 。 图 E-22 显示 了 一 个 带 时 钟 信号 的 SR 双 稳 态 多 谐振 荡 器 的 电路 。 其 他 双 稳 态 多 谐 
振 落 器 有 相同 的 外 加 电路 。 










b) 时 钟 D c) 时 钟 东 d) 时 钟 T 
图 E-21 时 钟 双 稳 态 多 谐振 荡 器 


a) 时 钟 SR 





E-22 ”时钟 SR 双 稳 态 多 谐振 荡 器 的 电路 


3. 寄存 器 
作为 同步 (时钟) 时 序 电 路 的 第 一 个 应 用 ， 我 们 将 介绍 一 个 寄存 器 的 简化 版 本 。 寄 存 器 
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是 一 个 个 二 进 制 位 的 存储 设备 ， 它 在 连续 的 时 钟 脉冲 间 存 储 它 的 数据 。 在 时 钟 的 触发 下 ， 
老 的 数据 被 抛弃 ， 被 新 的 数据 替代 。 

图 E-23 显示 了 一 个 4 位 的 寄存 器 ， 每 个 单元 是 由 一 个 D 双 稳 态 多 谐振 荡 器 构成 的 。 注 
意 : 时 钟 输入 对 所 有 单元 是 共有 的 。 我 们 旋转 了 我 们 以 前 的 符号 ， 这 样 使 得 连接 更 为 简单 。 





图 E-23 一 个 4 位 寄存 器 


4. 数字 计数 器 
一 个 nn 位 的 数字 计数 器 ( digital counter) 能 从 0 计数 到 2”-1。 例 如 ，n=4 时， 计数 器 的 
输出 是 0000，0001，0010，0011，…，1111， 所 以 它 能 从 0 计数 到 15。 一 个 n 位 的 计数 


器 可 以 由 nn 个 T 双 稳 态 多 谐振 荡 器 构成 。 在 开始 时 ,计数器 代表 0000， 计数 人 允许 线 (参见 
图 E-24 ) 带 有 1 的 队列 ， 也 就 是 被 计数 的 数据 (脉冲 )。 看 一 下 事件 的 序列 ， 我 们 可 以 看 到 
最 右边 的 位 与 计数 使 能 连接 线 的 每 一 个 正 的 转变 相反 ， 这 模拟 了 数据 项 的 达到 。 但 最 右边 的 
位 从 1 变 成 0， 紧 挨 着 最 右边 的 一 位 就 被 求 补 了 。 这 个 过 程 对 所 有 的 位 重复 。 这 个 观察 给 了 
我 们 使 用 T 双 稳 态 多 谐振 荡 器 的 一 条 线索 。 这 个 双 稳 态 多 谐振 荡 器 的 特征 表 显示 了 每 个 值 为 
1 的 输入 都 对 输出 求 补 。 注 意 : 这 个 计数 器 只 能 数 到 15 或 (1111),。 第 16 个 数据 项 的 到 达 将 
把 计数 器 重 置 回 到 (0000),。 图 E-24 显示 了 4 位 计数 器 的 电路 。 


计数 使 能 





E-24 一 个 4 位 计数 器 
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Foundations of Computer Science, Third Edition 


C、C++ 和 Java 程序 示例 


在 附录 的 这 一 部 分 ， 我 们 介绍 一 些 用 三 种 编程 语言 C、C++ 和 Java 写 的 例子 ， 整 体 上 
给 出 这 三 种 编程 语言 的 结构 概念 。( 注 意 每 行程 序 边 上 的 行 号 不 是 该 程序 的 一 部 分 ， 添 加 行 
号 是 为 了 引用 方便 。 也 要 注意 ， 在 程序 编译 成 机 器 语言 时 ， 着 色 标 出 的 注释 文字 是 被 编译 器 
忽略 掉 的 。 


F.1 用 C 语言 编程 


这 一 节 我 们 用 C 语言 来 示例 3 个 简单 的 程序 。 目 标 不 是 教 编程 语言 ， 只 是 给 你 一 个 用 C 
编程 是 什么 样 的 概念 。 

例 F.1 程序 F.1 是 用 C 语言 写 的 最 简单 的 程序 ， 该 程序 打印 出 “Helloe World !” 信 息 。 
这 是 一 个 只 用 顺序 结构 的 例子 ， 意 味 着 代码 逐 行 执行 ， 没 有 分 支 或 者 循环 。 


程序 F.1 第 一 个 C 语 言 写 的 程序 
/* 
This program show how we can use only sequence construct 
to achieve a simple goal. 
wh 


#include<stdio.h> 


OOOND- 


int main() 

9 { 

10 //Statement 

11 printf ("Hello Word\n™"); 
12 return 0; 


14 }//End of main 

Run: 

Hello Word 

例 F.2 程序 F.2 用 C 语 言 写 的 简单 程序 ， 该 程序 同时 用 到 了 顺序 和 分 支 结 构 。 如 果 条 
件 成 立 ， 程 序 执行 一 些 行 ; 如 果 不 成 立 ， 则 执行 另 一 些 行 。 我 们 运行 该 程序 两 次 来 显示 不 同 
的 情况 。 

程序 F2 第 二 个 C 语 言 写 的 程序 

yy 大 
This program shows how to make a decision in a program written in C. 


The program gets an integer and finds if it is divisible by 7. 
*/ 


#include<stdio.h> 


int main() 


{ 


OOOODPpP 
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10 //Declaration 

11 int num; 

12 //Statement 

13 printf ("Enter an integer:"); 

14 Scanf ("%d", gnum); 

Ls5 //Selection 

16 if(num % 7 == 0) 

b pg { 

18 printf ("The number %d",num); 

19 printf ("is divisible by 7.\n"); 
20 下 

21 else 

22 { 

23 printf ("The numbe %d",num); 

24 printf("is not divisible by 7.\n"); 
25 } 

26 return 0; 

27 }//End of main 

Run: 


Enter an integer:24 

The number 24 is not divisible by 7. 
Run: 

Enter an integer:35 

The number 35 is divisible by 7. 


例 F3 程序 F.3 显示 了 顺序 和 循环 结构 的 组 合 。 我 们 利用 循环 重复 打印 一 个 数字 , 但 
是 该 数字 每 次 重复 时 都 有 变化 。 我 们 运行 两 遍 程序 。 第 一 次 限制 为 6， 第 2 次 限制 为 9。 


程序 F3 ”第 三 个 C 语 言 写 的 程序 





来“ 

2 This Program Shows how to use repetition in C. 
3 The program prints number from 1 to n, in which n is given by the user. 
4 */ 

5 

6 #include<stdio.h> 

7 

8 int main() 

有 

10 //Declaration 

11 int n; 

2 int i; 

13 //Statemetn 

14 printf ("Enter the upper limit:"); 

15 scanf ("%d", gn); 

16 //Repetition 

二 for (i=1;i<=n;i++) 

18 { 

19 printf ("%d\n",i); 

20 } 


21 return 0; 

22 1}//End of main 

Run: 

Enter the upper limit:6 
L 

2 
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Run: 
Enter the upper limit:9 
1 


oO ND 


F2 用 C++ 语言 编程 


这 一 节 展示 如 何 用 C++ 语言 来 写 前 面 同样 的 3 个 程序 。 关 键 点 在 显示 两 者 之 间 的 相似 
性 和 不 同 处 。C 语言 是 没有 类 和 对 象 的 过 程 语言 。 而 C++ 语言 则 是 可 以 有 类 和 对 象 的 面向 
对 象 语 言 。 

例 F4 程序 F4 实现 了 与 程序 F-1 相同 的 目标 ， 但 却 是 用 C++ 语言 代替 了 C 语言 来 写 
的 。 我 们 可 以 在 14 行 看 到 主要 的 差别 。 在 C++ 中 打印 数据 ， 我 们 需要 使 用 一 个 对 象 。 术 语 
cout 定义 了 一 个 负责 输出 数据 的 对 象 。 


程序 F4 ”第 一 个 C++ 语言 写 的 程序 
~ 支 
The program demonstrates Some of the components of a simple 
program written in C++ 
A 


#include<iostream> 
#include<iomanip> 


co ~ 必 mWP 靖 


AD 


using namespace std; 


11 int main() 

12 1 

13 //Statement 

14 cout << "Hello World" << endl; 


15 return 0; 
16 }//End of main 
Run: 


Hello World 


例 F.5 程序 F.5 实现 了 与 程序 F.2 相同 的 目标 ， 但 却 是 用 C++ 语言 代替 了 C 语言 来 写 
的 。 该 程序 和 它 的 C 版 本 主要 的 差别 在 16、17、21、22、26 和 27 行 。 这 些 地 方 我 们 需要 
使 用 输入 对 象 (cin) 和 输出 对 象 (cout) 用 于 输入 和 输出 。 


程序 F5 ”第 二 个 C++ 语言 写 的 程序 


灶 /二 
4 This program shows how to make a decision in a program written in C++. 
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The program gets an integer and prints it if it is less than 50. 
4 


3 

4 

5 

6 #include<iostream> 
7 #include<iomanip> 
8 

9 


using namespace std; 


10 

11 int main() 

12 4 

13 //Declaration 

14 int num; 

15 //Statement 

16 cout << ("Enter an integer:"); 

17 cin >> num; » 

18 //Decision 

19 if(num % 7 == 0) 

20 { 

21 count << "The number" << num; 

22 count << "is divisible by 7." << endl; 
23 于 

24 else 

2 1 

26 count << "The number" << num; 

27 count << "is not divisible by 7." << endl; 
28 |} 


29 return 0; 

30 }//End of main 

Run: 

Enter an integer:22 

The number 22 is not divisible by 7. 
Run: 

Enter an integer:21 

The number 21 is not divisible by 7. 


例 F6 程序 F.6 实现 了 与 程序 F.3 相同 的 目标 , 但 却 是 用 C++ 语言 代替 了 C 语言 来 写 
的 。 该 程序 和 它 的 C 版 本 主要 的 差别 在 17、18 和 23 行 。 这 些 地 方 我 们 需要 使 用 输入 对 象 
(cin) 和 输出 对 象 (cout) 用 于 输入 和 输出 。 


程序 F.6 第 三 个 C++ 语言 写 的 程序 


1 

2 This program Shows how to use repetition in C++. 
3 The program prints number from 1 to n,in which n is given by the user. 
4 */ 

5 

6 #include<iostream> 

7 #include<iomanip> 

8 

9 using namespace std; 

10 

11 int main() 

12 { 


13 //Declaration 
14 int ny; 
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16 //Statement 
17 cout << "Enter the upper limit:"; 
1 Sil 2 ni 


19 

20 //loop 

21 forl(int i=1;i<=n;i++) 
22 { 

23 cout << i << endl; 
24 } 

25 


26 return 0; 
27 }//End of main 


Enter the upper limit 4 


F.3 用 Java 语言 编程 


这 一 节 ， 我 们 展示 如 何 用 Java 语言 来 写 前 面 同样 的 3 个 程序 。 关 键 点 在 显示 语言 之 
间 的 相似 性 和 不 同 处 。 我 们 遇 到 的 第 一 个 不 同 之 处 是 在 C++ 中 的 main 函数 和 在 Java 中 的 
main 方法 。 在 C++ 中 的 main 函数 是 独立 的 程序 ， 在 Java 中 的 main 方法 应 该 是 一 个 类 的 一 
部 分 。 我 们 分 别 在 这 些 程序 中 命名 这 些 类 为 Fist、Second、Third。 

例 F.7 程序 F.7 实现 了 与 程序 F.4 相同 的 目标 ,但 却 是 用 Java 语言 代替 了 C++ 语言 
写 的 。 我 们 需要 一 个 类 来 提供 main 方法 。 另 一 个 不 同 之 处 是 在 第 10 行 ， 我 们 使 用 一 个 预先 
定义 的 对 象 (System.cout) 负责 输出 。 


程序 F7 ”第 一 个 Java 语 言 写 的 程序 


十。 玫 

2 This Program demonstrates some of the components of a simple 
3 program written in Java 

4 */ 

5 

6 Public class First 

TT 沽 

8 public static void main(String[] args) 

9 { 

10 System.out.printIin ("Hello World!"),，; 


11 }//End main 
12 }//End class 
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例 F8 程序 F.8 实现 了 与 程序 F.5 相同 的 目标 ， 但 却 是 用 Java 语言 代替 了 C++ 语言 
来 写 的 。 我 们 需要 一 个 类 来 提供 main 方法 。 其 他 不 同 之 处 是 在 第 13、14、15、20、21、 
26 和 27 行 ， 那 里 我 们 使 用 一 个 类 的 对 象 Scanner 负责 输入 ， 以 及 一 个 预先 定义 的 对 象 
(System.cout) 负责 输出 。 


~ 上 wwPD 上 


FF FF FA 
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31 
32 


输出 。 


1 
2 


/* 


程序 F8 第 二 个 Java 语 言 写 的 程序 


This Program Shows how to make a decision in a Program written in Java. 
The program gets an integer and checks if it is divisible by 7. 


Ww 


import java.util.*; 


public class Second 


{ 


public static void main(Stirng[] args) 


{ 


//Declaration 

Scanner input = new Scanner (System.in); 
System.out.print ("Enter an integer:"); 
int num = input.nextInt(); 


//Decision 

if(num % 7 == 0) 

{ 
System.out .Print("The number" + num); 
System.out.printIin("is divisible by 7"); 


} 
else 


{ 
System.out.print ("The number" + num); 
System.out .PrintIn("is not divisible by 7."); 


} 


}//End main 


}//End class 
Run: 
Enter an integer:25 

The number 25 is not divisible by 7. 
Run : 
Enter an integer:42 

The number 42 is divisible by 7. 


例 F9 程序 F.9 实现 了 与 程序 F.6 相同 的 目标 ， 但 却 是 用 Java 语言 代替 了 C++ 语言 
来 写 的 。 我 们 需要 一 个 类 来 提供 main 方法 。 其 他 不 同 之 处 是 在 第 13、14、15 和 20 行 ， 那 
里 我 们 使 用 一 个 类 的 对 象 Scanner 负责 输入 ， 以 及 一 个 预先 定义 的 对 象 ( System.cout) 负责 


/* 


程序 F.9 第 三 个 Java 语 言 写 的 程序 


This program shows how to use a loop in Java. 
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3 The program prints number from 1 to n,in which n is given by the user. 
4 */ 

马 

6 import java.util.*; 

7 

8 Ppublic class Third 

二 这 

2 public static void main(Stirng[] args) 

3 { 

4 //Statements to get the value of n 

5 Scanner input = new Scanner (System.in); 
6 Scanner.out.print ("Enter the upper limit:"); 
7 int n = input.nextInt(); 

8 

9 //Loop 

10 for (int i = 1;i<= n;i++) 

11 { 

12 System.out.printIn (i); 

13 } 

14 }//End main 

15 

14 }//End class 

Run: 

Enter the upper limit:3 

1 

2 

3 

Run: 


Enter the upper limit:7 


FADpr 
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Foundations of Computer Science, Third Edition 


数学 知识 





在 附录 的 这 一 部 分 ， 我 们 将 复习 一 些 数 学 概念 ， 它 们 能 帮助 我 们 理解 本 书 中 的 主题 。 我 
们 首先 给 出 一 个 简短 的 关于 指数 和 对 数 函 数 的 论述 ， 接 着 讨论 模 运 算 ， 最 后 ， 我 们 给 出 在 数 
据 压 缩 中 使 用 的 离散 余弦 变换 的 公式 。 


G.1 指数 和 对 数 


在 本 书 一 些 问题 的 求解 过 程 中 ， 我 们 经 常 需要 知道 如 何 处 理 指数 和 对 数 函 数 。 这 一 节 我 
们 简短 地 回顾 一 下 这 两 个 概念 。 


G.1.1 指数 函数 


底 (base) 为 a 的 指数 函数 定义 为 a*。 如 果 x 是 一 个 整数 ， 这 个 可 以 解释 成 a 与 自身 相 
乘 了 x 次 。 通 常 我 们 可 以 使 用 一 个 计算 器 得 到 yy 的 值 。 

例 G.1 计算 下 列 指数 函数 的 值 。 

a. 32 

b. 5.25 

解 ” 使 用 关于 指数 的 解释 ， 我们 有 : 

a. 3:=33=9 

b. 5.26=5.2X5.2X5.2X5.2X5.2X5.2=19 770.609 664 

例 G.2 计算 下 列 指数 函数 的 值 。 

a. 372 

b. 5.243 

解 ” 这 些 问题 使 用 计算 器 更 容易 解决 ， 我 们 有 : 

a. 322 ~ 11.212 

b. 5.263 2 32 424.60 

1. 三 个 常用 的 底 

在 表达 式 a* 中， 我 们 称 a 为 底 ，2 为 指数 。 三 个 常用 的 底 是 : 底 10、 底 e 和 底 2。 

e 底 10 是 十 进 制 系统 的 底 。 大 多 数 计算 器 上 都 有 一 个 10* 键 。 

e。 在 科学 和 数学 中 使 用 的 底 是 自然 底 e ( natural base e)，e 的 值 为 2.718 281 83…， 大 
多 数 计算 器 上 都 有 一 个 e* 键 。 因 为 诸如 像 放 射 性 衰变 这 些 现 象 可 以 用 这 个 底 得 到 最 
好 的 描述 ， 所 以 这 个 底 用 在 科学 方面 。 

e 在 计算 机 科学 中 通常 需要 的 底 是 2。 大 多 数 计算 器 上 虽然 没有 2* 键 ,但 我 们 可 以 使 
用 一 般 的 x’” 键 ,设置 x=2。 

例 G.3 计算 下 列 指数 函数 的 值 。 

a. e4 

b.e53 
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c. 1033 
d. 253 
e. 210 
解 
a.e4 全 54.60 
b. e53 ~ 544.57 
c. 1033 2 1995.26 
d. 253 ~ 78.79 
e. 210-1024 


例 G.4 在 计算 机 科学 中 ,， 占 主导 地 位 的 底 是 2。 知道 一 些 常 用 指数 2 的 才 是 一 个 好 的 
练习 ， 我 们 经 常 需要 记 住 : 


2'=1 2 =2 22=4 2’=8 24= 16 25= 32 25= 64 
27=128 2:=256 2?=512 2'°= 1024 

2. 指数 函数 的 性 质 

指数 函数 有 多 个 性 质 ， 其 中 一 些 对 我 们 非常 有 用 : 

1.a"=1 2.a=a 3.a™*= 1/(a”) 


4. ay= CrX 邮 5.0m7= ao 6. (ay= ao 
例 G.5 使 用 这 些 性 质 的 例子 有 : 

a. 5°=1 

b.6°=6 

c. 24= 1/24= 1/16 = 0.062 5 

d. 253=25X2= 32X8=256 

e. 323= 32/33= 9/27 = 1/3 之 0.33 

f (104)*= 104*?= 108= 100 000 000 


G.1.2 ”对 数 函 数 
对 数 函 数 是 指数 函数 的 倒数 ， 表 示 如 下 : 


y=a” + X=1ogay 

就 像 在 指数 函数 中 一 样 ，a 被 称 为 对 数 函 数 的 底 。 换 言 之 ， 如 果 给 定 x， 我们 可 以 使 用 
指数 函数 计算 出 y; 如 果 给 定 y， an 和 zx 

指数 函数 和 对 数 函数 互 为 倒数 。 

因为 对 数 能 把 乘法 运算 转变 为 加 法 运算 ， 将 指数 运算 转变 为 乘法 运算 ， 所 以 它 使 算术 中 
的 计算 变 得 容易 了 。 

例 G.6 计算 下 列 对 数 函 数 的 值 : 

a. log39 

b. log216 

c. logio0 

d.log2(-2) 

解 ”我们 还 没有 介绍 如 何在 不 同 的 底 上 计算 对 数 函 数 ， 但 我 们 可 以 直观 地 解决 这 些 
问题 。 
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a. 因为 3*=9， 所 以 log;9=2， 使 用 这 两 个 函数 互 为 倒数 这 个 事实 。 

b. 相似 地 ， 因 为 24=16， 所 以 logz16=4。 

c. 因为 不 存在 有 限 数字 x*， 使 得 10=0， 所 以 logio0 就 是 无 意义 的 或 数学 上 的 负 无 穷 大 。 

d. 在 实数 数学 中 ， 负 数 是 无 对 数 的 。 但 是 在 复杂 数字 领域 中 ， 我 们 是 可 以 有 负数 的 对 数 
的 ， 这 里 ， 我 们 把 这 些 问 题 留 给 关于 复杂 数字 理论 的 书 。 

1. 三 种 常用 的 底 

与 指数 函数 的 情况 一 样 ， 对 数 中 也 有 三 个 常用 的 底 : 底 10、 底 。 和 底 2。 以 e 为 底 的 对 
数 通常 写成 In (自然 对 数 )， 以 10 为 底 的 写成 log (省 略 了 底 )。 并 不 是 所 有 的 计算 器 有 以 2 
为 底 的 对 数 的。 我 们 马上 会 显示 如 何 处 理 这 个 底 。 

例 G.7 计算 下 列 对 数 函 数 的 值 : 

a. log233 

b. ln45 

解 ” 对 于 这 两 个 底 ， 我们 能 使 用 计算 器 : 

a. log233 < 2.367 

b. ln45 ~ 3.81 

2. 底 转 换 

我 们 经 常 需 要 求 一 个 底 既 不 是 e 也 不 是 10 的 对 数 函 数 的 值 。 如 果 手 头 的 计算 器 不 能 给 
出 我 们 希望 的 结果 ， 那 么 我 们 可 以 使 用 对 数 函 数 的 基本 特性 ( 底 转换 )， 显 示 如 下 : 

logsy 
logy = logsa 

注意 : 右边 显示 了 两 个 以 5 为 底 的 对 数 函 数 ， 它 与 左边 以 a 为 底 的 不 同 。 这 就 意味 着 我 
们 可 以 选择 一 个 在 我 们 计算 器 上 可 用 的 底 ( 底 5)， 计 算出 计算 器 上 没有 的 底 ( 底 a) 的 对 数 。 

例 G.8 计算 下 列 对 数 函 数 的 值 : 

a. log3810 

b. logs600 

c. log21024 

d. log2600 

解 ” 这 些 底 通常 在 计算 器 上 都 没有 ， 但 我 们 可 以 使 用 底 10， 这 是 计算 器 上 有 的 。 

a. log3810=1log810/log3=2.908/0.477 ~ 6.095 

b. log5600=1log600/log$=2.778/0.699 ~ 3.975 

c. log21024=1log1024/log2=3.01/0.301=10 

d. log2600 = log600/log2 六 2.778/0.301 3 9.223 

例 G.9 底 2 在 计算 机 科学 中 非常 普遍 。 既 然 我 们 知道 logio2 守 0.301, 这 就 非常 容易 计 
算出 〈 近 似 值 ) 这 个 底 的 对 数 。 我 们 先 求 出 这 个 数 以 10 为 底 的 对 数 ， 再 除 以 0.310。 或 者 在 
这 个 以 10 为 底 的 对 数 上 乘 以 3.332( 守 1/0.301)。 

a. log2600 ~ 3.332 X log10600 ~ 3.332X2.778 ~ 9.228 

b. log22048 六 3.332X loglo2048 一 3.332X2.778= 11 

3. 对 数 函 数 的 性 质 

对 数 函 数 有 6 个 有 用 的 性 质 ， 每 一 个 都 与 前 面 提 到 的 指数 函数 的 性 质 相 对 应 。 

1. logal=0 4. loga(x Xy)= logax + logay 
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2. logca = 1 5. loga(x/y) = logax—logay 
3. loga(1/x) = —logax 6. logax’ = yX logax 
例 G.10 计算 下 列 对 数 函 数 的 值 : 

a. logsl 

b. log33 

c. logovio 

d. loga(xXy), 如 果 知 道 logsx=2 和 logay=3 

e. loga(x/y)， 如 果 知 道 logox =2 和 logay =3 

f logz(1024)， 不 使 用 计算 器 

解 ” 我 们 利用 对 数 函 数 的 性 质 来 解决 这 些 问题 : 

a. log3l=0 

b. log33=1 

c. log(1/10)=log10"'=-log10=-1 

d. loga(x Xy)=logax + logay =2 + 3=5 

e. loga (Xx/y)=logax—logay =2-3=-1 

f log2(1024)=1log2(2'")=10X1log22=10X1=10 


G.2 ” 模 运 算 

在 整数 运算 中 ， 如 果 我 们 用 a 除 以 x， 就 能 得 到 g 和 +。4 个 整数 间 的 关系 可 以 写成 : 
a=qgXn + r。 在 这 个 等 式 中 ，a 称 为 被 除数 ，n 为 除数 ，g 为 商 ，r 为 余数 。 既 然 一 个 运算 
通常 定义 成 带 有 一 个 单一 的 输出 ， 所 以 这 个 等 式 不 是 运算 ,我 们 称 之 为 除法 关系 ( division 


relation ) 。 








例 G.11 假定 a=214，z=13， 用 我 们 在 16+ 4 
算术 中 所 学 的 除法 ， 可 以 得 出 gq=16, r=6。 rp mn 一 > 13 214<——a 
如 图 G-1 所 示 。 六 除数 二 

大 多 数 计算 机 语言 可 以 使 用 语言 指定 的 | 高， 二 
运算 符 求 得 商 和 余数 。 例 如 ， 在 C 语言 中 ， 人 
除法 运算 符 (/) 可 以 得 出 商 ， 模 运算 符 (%) 图 G-1 整数 除法 
可 以 得 出 余数 。 

G.2.1 模 运 算 符 


在 模 运 算 中 ， 我 们 只 对 一 个 输出 〈 余 数 >) 感 兴 趣 ， 我 们 不 关心 商 q。 换 言 之 ， 当 a 除 
以 nn 时， 我们 想 要 知道 的 是 x 的 值 是 多 少 。 这 就 意味 着 可 以 把 上 面 的 关系 转换 成 带 有 两 个 输 
和 人 a 和 与 一 个 输出 r+ 的 二 元 运算 。 那 么 这 个 二 元 运算 符 被 称 为 模 运 算 符 ( modulo opertor)， 
表示 成 mod。 第 二 个 输入 (nn) 称 为 模 数 (modulus)， 输 出 > 称 为 余数 (residue)。 图 G-2 显 
示 了 除法 关系 与 模 运 算 符 的 比较 。 

模 运 算 符 带 一 个 整数 (a) 和 一 个 模 数 (n)， 得 到 余数 (r+)。. 虽 然 a 和 +r 可 以 是 任何 整 
数 ， 但 不 能 为 0， 因 为 否则 得 出 除 以 0， 这 个 会 产生 一 个 无 定义 或 无 穷 大 的 数 。 但 在 实 
际 中 ,我 们 要 求 n 的 值 为 非 负 数 。 由 于 这 个 原因 ,r 的 值 应 该 在 0 与 n-1 之 间 ( 原 书 有 误 一 一 
译 者 注 )。 
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| (运算 ) 





图 G-2 除法 关系 与 模 运 算 符 


例 G.12 使 用 模 运算 一 个 非常 好 的 例子 是 时 钟 系统 。 时 钟 是 基于 模 12 运算 的 。 但 是 时 
钟 上 的 整数 12 实际 上 应 该 是 0， 这 样 使 它 与 模 运 算 相 一 致 。 

例 G.13 求 下 列 运 算 的 结果 : 

a. 28 mod 6 

b. 32 mod 12 

c. 19 mod 15 

d.7mod11 

解 ” 我 们 求 余 数 r-， 可 以 用 nn 除 a， 得 到 g 和 rr。 丢弃 g, 保存 +。 

a. 28 除 以 6 得 到 >=4， 这 意味 着 28 mod 6=4。 

b. 32 除 以 12 得 到 r=8， 这 意味 着 32 mod 12=8。 

c. 19 除 以 15 得 到 r=4， 这 意味 着 19 mod 15=4。 

d.7 除 以 11 得 到 r=7， 这 意味 着 7 mod 11=4。 


G.2.2 算术 运算 


我 们 在 整数 中 讨论 的 三 种 二 元 运算 (加 法 、 减 法 和 乘法 ) 也 可 以 针对 模 运 算 定义 。 如 果 
结果 大 于 n-1， 我 们 可 能 需要 规范 化 结果 (应 用 
mod 运算 ， 取 余数 )， 如 图 G-3 所 示 。 


运算 
实际 上 ， 这 里 有 两 组 二 元 运算 符 ， 第 一 组 二 
是 二 元 运算 符 (+、-、X) 中 的 一 个 ， 第 二 组 是 (a-b)modn=c 
mod 运算 符 。 我 们 需要 使 用 括号 来 强调 运算 的 (Coxbmodn=e 


顺序 。 在 计算 过 程 中 的 任何 时 候 ， 如 果 得 到 一 
个 负 值 的 >， 这 个 值 就 应 该 规范 化 。 我 们 需要 在 
这 个 结果 上 加 上 模 若 干 次 ， 直 到 这 个 结果 为 正 
为 止 。 _ 图 G-3 ” 模 运 算 中 的 三 种 运算 

例 G.14 进行 下 列 运 算 : 

a. 14 加 上 7， 以 15 为 模 

b.7 减 11， 以 13 为 模 

c. 11 乘 以 7， 以 20 为 模 

解 ”下面 显 示 了 涉及 每 个 问题 的 两 步 : 

(14+7)mod15 — (21) mod 15=6 

(7-11) mod13 — (-4) mod 13=-4+13=9 

(7X11) mod20 一 (77) mod 20=17 
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例 G.15 进行 下 列 运算 : 

a. 17 加 上 27， 以 14 为 模 

b. 12 减 43， 以 15 为 模 

c. 123 乘 以 -10， 以 19 为 模 

解 ” 注意: 这 些 例子 中 的 整数 有 时 超出 了 0 到 n-1 的 范围 ,我们 可 以 在 运算 前 规范 化 它 
们 ， 也 可 以 在 运算 后 进行 。 我 们 显示 的 是 第 二 种 选择 ， 读 者 可 以 试 一 下 第 一 种 选择 ， 二 者 的 
结果 是 相同 的 。 

(17+27)mod14 — (44) mod 14=2 

(12-43) mod 15 一 (-31) mod15=-1+15=4 

(123X-10) mod 19 — (-1230) mod 19=-14 + 19=5 

模 2 运算 

模 2 运算 具有 特殊 的 意义 。 因 为 模 是 2， 我 们 能 使 用 的 值 只 有 0 和 1。 这 样 的 算术 运算 
是 非常 简单 的 。 下 面 显 示 了 我 们 是 如 何在 两 位 间 进 行 加 减 的 。 


加 : (0+0) mod 2=0 (0+ 1) mod 2=1 
(1+0) mod 2=1 (1+1)mod2=0 

减 : (0-0) mod 2=0 (0-1) mod 2=1 
(1-0) mod 2=1 (1-1) mod 2=0 


特别 要 注意 的 是 加 法 和 减法 给 出 了 相同 的 结果 。 在 这 种 算术 中 ， 我 们 可 以 用 XOR ( 异 
或 ) 运算 来 代替 加 减法 。 如 何 两 位 是 相同 的 ，XOR 运算 的 结果 为 0 ; 如果 两 位 不 同 ， 则 为 
1。 图 G-4 显示 了 这 个 运算 。 


0@ 0=0 1@ 1=0 


a) 两 位 相同 ， 结 果 为 0 
b) 两 位 不 同 ， 结 果 为 1 c) 两 个 字 异 或 的 结果 
图 G-4 ”两 个 一 位 的 异 或 与 两 个 字 的 异 或 





G.3 一 离散 余弦 变换 

本 节 我 们 给 出 离散 余弦 及 反 离 散 余弦 变换 的 数学 背景 ， 这 种 变换 被 用 在 第 15 章 中 所 讨 
论 的 数据 压缩 中 。 
G.3.1 ”离散 余弦 变换 


在 这 项 变换 中 ， 每 个 64 像素 的 块 进行 称 为 离散 余弦 变换 (DCT) 的 转变 。 该 转变 改变 
了 这 64 个 值 ， 以 便 保 持 像 素 间 相关 的 关系 而 去 掉 元 余 。 下 面 的 公式 中 ，P(x, y) 定义 了 图 像 
块 中 一 个 特定 的 值 ，7T(m, n) 定义 了 在 转换 后 的 块 中 的 一 个 值 。 


元 了 
T(m,n) = 0.25c(m)c(n) ,Ploy) oom] Lee |eosl 2 | 


六 时 oli) = | 因果 
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G.3.2 ” 反 离 散 余弦 变换 
该 反 变换 用 于 从 T(m, n) 表 中 创建 P(x, y) 表 。 


3 了 
P(x,y) = 0.25c(x)c(y) >» > T(m,n)eos[ St er |eos[ (2n 这 | 
m=0n=0 
这 里 c(i) = hg 如 果 i =0 


其 他 


例 G.16 如 果 对 于 所 有 的 x 和 y》，P(x,y)=20， 计算 7T(0, 0) 和 7(0, 1)。 
解 ” 使 用 和 之 积 恒 等 变 换 cosx + cosy=2[cos(x + yy)/2][cos(x-y)/2]， 我 们 可 以 看 出 所 有 余 
弱项 之 和 为 0。 
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误差 检测 和 校正 





当 数据 从 一 个 地 方 传输 到 另 一 个 地 方 ， 或 从 一 个 设备 移动 到 另 一 个 设备 时 ， 必 须 检 查 数 
据 的 准确 性 。 在 大 多 数 应 用 中 ， 系 统 必 须 保 证 接收 到 的 数据 和 传输 的 数据 是 相同 的 。 有 些 应 
用 却 能 容忍 小 的 误差 。 例 如 ， 在 音频 和 视频 传输 过 程 中 随机 误差 是 可 以 容忍 的 ， 但 传输 一 个 
文本 时 ， 我 们 希望 非常 高 的 准确 性 。 我 们 虽然 只 讨论 传输 中 的 误差 ， 但 在 存储 中 由 于 数据 损 
坏 产 生 的 误差 也 以 同样 的 方法 来 处 理 。 


H.1 引言 
我 们 先 讨论 与 误差 检测 和 校正 有 关 的 一 些 问题 。 
H.1.1 误差 的 种 类 


由 于 传输 介质 中 的 干扰 ， 如 串扰 、 外 部 的 电磁 场 等 ， 不 管 何 时 数据 位 从 一 个 地 方 流向 另 
一 个 地 方 ， 它 们 总 要 遭受 不 可 预见 的 变化 ， 如 图 H-1 所 示 。 


2 
发 送 六 
[olololo 加 oo [of ilof ofofololoflolifofofololili1l 
0 变 成 1 | | 损坏 的 比特 
[olofof oofilo]| [of1 [oR 二 1 001 ofofoli[1| 
接收 接收 
a) 单 比特 错误 b) 突 发 错误 


图 H-1 单位 误差 与 区 间 误 差 


在 单位 误差 (single-bit error) 中 ，0 变 成 1 或 1 变 成 0。 在 区 间 误 差 ( burst error) 中 ， 
多 个 比特 被 改变 。 单 位 误差 的 意思 是 在 所 给 的 数据 单元 (如 一 个 字 节 、 一 个 字符 或 一 个 数据 
包 ) 中 ， 只 有 一 位 从 1 变 成 0, 或 从 0 变 成 1。 区 间 误 差 的 意思 是 在 数据 单元 中 有 两 位 或 两 
位 以 上 从 1 变 成 0 或 从 0 变 成 1。 


H.1.2” 宛 余 


校正 误差 中 的 中 心 概念 就 是 宛 余 (redundancy)。 为 了 能 校正 误差 ， 需 要 与 数据 一 起 传送 
额外 的 数据 位 。 这 些 宛 余 位 由 发 送 者 加 上 ， 由 接收 者 移 除 。 它 们 的 存在 允许 接收 者 校正 损坏 





误差 的 校正 比 检测 困难 得 多 。 在 误差 检测 ( error detection) 中 ,我 们 只 看 一 下 是 否 有 误 
差 ， 答案 是 简单 的 有 或 无 。 我 们 甚至 不 关心 误差 的 数目 ， 对 我 们 来 说 单位 误差 和 区 间 误 差 是 
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同样 的 。 

在 误差 校正 中 ， 我 们 需要 知道 损坏 位 的 准确 数目 ， 更 重要 的 是 它们 在 消息 中 的 位 置 。 误 
差 的 数目 和 消息 的 大 小 都 是 重要 的 因素 。 如 果 需 要 在 8 位 数据 单元 中 校正 一 个 误差 ， 我 们 需 
要 考虑 8 种 可 能 的 误差 位 置 。 如 果 在 同样 大 小 的 数据 单元 中 校正 两 个 误差 ， 我 们 需要 考虑 
28 (7+6+…+1) 种 可 能 性 。 你 可 以 想象 一 下 接收 者 在 1000 位 的 数据 单元 中 找到 10 个 误 
差 的 难度 。 


H.1.4 向 前 误差 校正 与 重 传 


有 两 种 误差 校正 的 主要 方法 。 向 前 误差 校正 ( forward error correction ) 是 接收 者 用 宛 余 
位 去 努力 猜测 消息 的 过 程 。 如 果 误 差 数 目 比 较 小 ， 这 是 有 可 能 的 ， 正 如 我 们 后 面 会 看 到 的 。 
重 传 ( retransmission) 校正 是 接收 者 检测 到 误差 ， 要 求 发 送 者 再 次 发 送 消息 的 技术 。 重 发 是 
一 个 重复 的 过 程 ， 直 到 接收 者 相信 到 达 的 数据 是 无 误差 的 。 通 常情 况 下 ， 不 是 所 有 的 误差 都 
能 被 检测 到 。 


H.1.5 编码 


宛 余 可 以 通过 各 种 编码 方案 来 实现 。 发 送 者 通过 创建 元 余 位 和 实际 数据 位 间 的 关系 的 过 
程 来 增加 宛 余 位 。 接 收 者 检查 两 组 数据 位 来 检测 或 校正 误差 。 宛 余 位 和 数据 位 的 比例 以 及 过 
程 的 健壮 性 是 任何 编码 方案 的 重要 因素 。 图 H-2 显示 了 编码 的 一 般 概 念 。 
发 送 者 接收 者 


消息 和 元 余 人 接收 到 的 消息 





图 H-2 ”编码 器 和 译 码 器 的 结构 


可 以 把 编码 系统 分 成 两 大 类 : 块 编码 (block coding) 和 回旋 编码 ( convolution coding ) 。 
附录 只 讨论 块 编码 ， 回 旋 编 码 比 较 复 杂 ， 超 出 了 本 书 的 范围 。 块 编码 使 用 模 运 算 ， 正 如 附录 
G 中 讨论 的 。 

我 们 只 讨论 块 编码 ， 回 旋 编 码 请 参阅 高 级 的 书籍 。 


H.2 块 编码 


在 块 编码 中 ， 我 们 把 消息 分 成 块 〈 每 块 上 位 )， 称 为 数据 字 ( dataword)。 我 们 给 每 个 块 
加 上 + 宛 余 位 ， 使 得 长 度 n=k +r。 得 到 的 位 的 块 称 为 码 字 (codeword)。 额 外 的 + 位 是 如 
何 选择 或 计算 的 将 在 后 面 讨论 。 现 在 ， 我 们 知道 有 一 组 数据 字 (每 个 大 小 为 k) 和 一 组 码 字 
(每 个 大 小 为 n)， 这 是 很 重要 的 。 

使 用 位 ,我 们 能 创建 2 个 数据 字 组 合 ; 使 用 位， 我 们 能 创建 2 个 码 字 组 合 。 因 为 
n>k， 所 以 码 字 的 可 能 数目 大 于 数据 字 的 可 能 数目 。 块 编码 过 程 是 一 对 一 的 ， 同 样 的 数据 字 
总 是 编码 成 同样 的 码 字 。 这 就 意味 着 我 们 有 2"-2* 个 码 字 没 有 使 用 ， 称 这 些 码 字 为 无 效 的 或 
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非法 的 。 图 H-3 说 明了 这 种 情况 。 


… | 
每 块 2 个 可 能 的 数据 字 每 块 2" 个 可 能 的 码 字 ( 其 中 只 有 2: 个 是 有 效 的 ) 
图 H-3 在 块 编码 中 的 数据 字 和 码 字 
例 H.1 假设 消息 由 一 个 8 位 的 块 构成 (k=8)。 这 里 有 2256 种 可 能 的 数据 字 组 合 。 
如 果 我 们 增加 2 个 元 余 位 (r=2 )， 那 么 每 个 可 能 的 码 字 是 10 位 (n=10)， 全 部 可 能 的 码 字 
数目 是 2"=1024。 这 意味 着 有 1024-256=768 个 码 字 是 无 效 的 。 如 果 这 些 无 效 的 码 字 被 接 
收 ， 那 么 接收 者 就 知道 码 字 损坏 了 。 


H.2.1 误差 检测 








误差 是 如 何 用 块 编码 检测 到 的 ? 如 果 满 足下 列 两 个 条 件 ， 则 接收 者 就 检测 出 原始 码 字 的 
变化 。 
1 ) 接收 者 有 (或 能 找到 ) 有 效 码 字 表 。 
2 ) 原始 码 字 被 改 成 无 效 的 。 
图 H-4 显示 了 块 编码 在 误差 检测 中 的 作用 。 
发 送 者 


不 可 靠 传输 





图 H-4 块 编码 中 的 误差 检测 过 程 


发 送 者 使 用 生成 器 从 数据 字 中 创建 码 字 ， 生 成 器 应 用 编码 的 规则 和 过 程 〈 后 面 讨论 )。 
每 一 个 发 送 到 接收 者 的 码 字 在 传输 过 程 都 可 能 改变 。 如 果 接 收 的 码 字 与 一 个 有 效 的 码 字 相 
同 ， 则 字 被 接受 ， 相 应 的 数据 字 从 中 提取 出 来 使 用 ;如果 接收 的 码 字 是 无 效 的 ， 它 就 被 
丢弃 。 

但 是 ， 如 果 码 字 在 传输 过 程 中 受到 损坏 ， 而 接收 字 仍然 匹配 了 一 个 有 效 的 码 字 ， 那 么 误 
差 仍然 未 被 检测 出 来 。 因 此 ， 这 种 编码 只 能 检测 单个 错误 ， 同 一 码 字 中 的 两 个 或 多 个 误差 可 
能 遗留 而 未 被 检测 出 来 。 

例 H.2 假设 t=2, n=3, 表 H-1 显示 了 数据 字 和 定义 的 码 字 的 列表 ， 这 是 发 送 者 和 接 
收 者 双方 认可 的 。 下 面 我 们 将 显示 如 何 从 一 个 数据 字 推 导出 一 个 码 字 。 

表 H-1 误差 检测 编码 ( 例 H.2 ) 
数 据 字 
00 





01 


误 考 检测 布 贡 正 389 


假设 发 送 者 把 数据 字 01 编码 为 011， 然 后 把 它 发 送 给 接收 者 ， 考 虑 下 列 情 况 : 

1 ) 接收 者 收 到 011， 这 是 一 个 有 效 的 码 字 ， 接 收 者 从 中 提取 出 数据 字 01。 

2 ) 在 传输 过 程 中 ， 码 字 受 到 损坏 ， 接 收 到 的 是 111， 也 就 是 说 最 左边 的 位 受到 损坏 。 
这 是 一 个 无 效 的 码 字 ， 所 以 它 被 丢弃 。 

3 ) 在 传输 过 程 中 ， 码 字 受 到 损坏 ， 接 收 到 的 是 000， 也 就 是 说 右边 的 两 位 受到 损坏 。 
这 是 一 个 有 效 的 码 字 ， 接 收 者 错误 地 从 中 提取 数据 字 00。 两 位 受到 损坏 使 得 误差 未 被 发 现 。 

二 的 江 夫 ， 其 他 类 型 的 误差 可 能 仍然 未 

检测 出 来 。 
H.2.2 ”误差 校正 

误差 校正 比 误差 检测 要 困难 得 多 。 在 误差 检测 中 ， 接 收 者 只 需要 知道 接收 的 码 字 是 无 效 
的 ; 在 误差 校正 中 ， 接 收 者 需要 查找 (或 猜测 ) 发 送 过 来 的 原始 码 字 。 与 误差 检测 相 比 ， 在 


误差 校正 中 我 们 需要 更 多 的 元 余 比 特 。 图 H-5 显示 了 块 编码 在 误差 校正 中 的 作用 。 我 们 可 以 
看 出 其 概念 与 误差 检测 是 相同 的 ， 但 生成 器 和 检查 器 的 功能 却 要 复杂 得 多 。 


发 送 者 接收 者 





不 可 靠 传输 





图 H-5 误差 校正 中 编码 器 和 译 码 器 的 结构 


例 H.3 对 例 H.2 增加 更 多 的 元 余 位 ， 去 看 看 接收 者 能 否 在 不 知道 实际 传送 数据 的 前 提 
下 校正 一 个 误差 。 我 们 给 2 位 数据 字 加 上 3 个 元 余 位 ， 构 成 5 位 的 码 字 。 后 面 会 介绍 如 何 选 
择 元 余 位 。 现 在 我 们 专心 研究 误差 校正 的 概念 。 表 H-2 显示 了 数据 字 和 码 字 。 


表 H-2 误差 校正 编码 ( 例 H.3 ) 


数 据 字 
00 
01 


假设 数据 字 是 01， 发 送 者 通过 查阅 表格 (或 使 用 算法 ) 建立 了 码 字 01011。 码 字 在 传输 
过 程 中 受到 损坏 ， 接 收 的 是 01001 (右边 的 第 二 位 出 现 了 误差 )。 首 先 ， 接 收 者 发 现 接收 的 
码 字 不 在 表 中 ， 这 意味 着 有 误差 发 生 。( 校 正之 前 必须 进行 检查 )。 接 收 者 假设 只 有 一 位 受到 
损坏 ,使 用 下 列 策略 去 猜想 正确 的 数据 字 : 

1 ) 接收 到 的 码 字 与 表 中 第 一 个 码 字 进行 比较 ( 01001 与 00000 )， 因 为 有 两 位 不 同 ， 所 
以 接收 者 认为 第 一 个 码 字 不 是 发 送 过 来 的 字 。 

2 ) 由 于 同样 的 原因 ， 原 始 码 字 不 可 能 是 表 中 的 第 三 和 第 四 个 码 字 。 

3 ) 原始 码 字 肯定 是 表 中 的 第 二 个 码 字 ， 因 为 它 与 接收 到 的 码 字 间 只 有 一 位 不 同 。 接 收 
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者 用 01011 替换 了 01001， 并 通过 查 表 ， 得 到 数据 字 是 01。 


H.3 ”线性 块 编码 


现在 使 用 的 所 有 块 编码 几乎 都 是 线性 块 编码 ( linear block code) 的 子 集 。 误 差 检测 和 校 
正 的 错误 检测 与 纠正 的 非 线 性 块 编码 之 所 以 没有 广泛 使 用 ， 是 因为 它们 的 结构 使 得 理论 分 析 
和 实现 都 很 困难 。 因 此 ， 我 们 只 关注 线性 块 编码 。 
线性 块 编码 的 正式 定义 需要 抽象 代数 (特别 是 伽 罗 瓦 域 ) 的 知识 ， 这 些 知识 超出 了 本 书 
的 范围 ， 因 此 我 们 给 出 一 个 非 正式 的 定义 。 对 于 我 们 的 目的 来 说 ， 线 性 块 编码 是 其 中 两 个 有 
效 码 字 进行 异 或 运算 ( 模 2 加 法 ， 附 录 G 中 讨论 的 ) 产生 另外 一 个 有 效 码 字 的 过 程 。 
在 线性 块 编码 中 ， 任意 两 个 有 效 的 码 字 进行 异 或 ( XOR) 运算 生成 另 一 个 有 效 
例 H.4 下 面 看 一 下 表 H-1 和 表 H-2 定义 的 编码 是 否 属于 线性 块 编码 。 
e 因为 任意 码 字 与 任意 其 他 码 字 的 异 或 运算 都 是 一 个 有 效 的 码 字 ， 所 以 表 H-1 中 的 方 
案 是 线性 块 编码 。 例 如 ， 第 二 和 第 三 个 码 字 蜡 或 得 到 第 四 个 码 字 。 
。 表 H-2 中 的 方案 也 是 线性 块 编码 ， 我 们 能 通过 其 他 两 个 码 字 的 异 或 运算 得 出 所 有 4 个 
码 字 。 


一 些 线性 块 编码 


我 们 来 看 一 些 线性 块 编码 。 这 些 编码 是 简单 的 ， 因 为 我 们 能 很 容易 发 现 编码 和 译 码 算 
法 ， 并 检查 它们 的 性 能 。 

1. 简单 奇偶 校 验 码 

也 许 最 熟悉 的 误差 检测 编码 是 简单 奇偶 校 验 码 (simple parity-check code)。 在 此 编码 中 ， 
位 的 数据 字 被 改变 成 n 位 的 码 字 ， 这 里 n=k+1。 额 外 的 位 ( 称 为 奇偶 检验 位 ) 被 加 到 预先 
定义 的 位 置 。 奇 偶 校 验 位 的 选择 原则 是 使 码 字 中 1 的 总 数 为 偶数 。 虽 然 有 些 实现 指定 1 的 总 
数 为 奇数 ， 但 我 们 只 讨论 偶数 的 情况 。 

简单 奇偶 校 验 码 是 单一 位 的 误差 检查 编码 ， 其 中 m=K+ 1。 

第 一 个 编码 ( 表 H-3 ) 是 一 奇偶 校 验 码 ， 其 中 k=2，n=3。 表 H-3 中 的 编码 也 是 奇偶 校 

验 编码 ， 其 中 k=4， n=5。 
表 H-3 简单 奇偶 校 验 码 C(5, 4) 
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H-6 显示 了 编码 器 (位 于 发 送 者 中 ) 和 译 码 器 (位 于 接收 者 中 ) 的 一 个 可 能 结构 。 

编码 器 使 用 一 个 生成 器 ， 该 生成 器 使 用 4 位 数据 字 的 一 个 副本 (ao。，a!，az 和 a3 )， 生 成 
一 个 奇偶 校 验 位 (ro)。 数 据 字 二 进 制 位 和 奇偶 校 验 位 组 成 了 5 位 的 码 字 。 加 上 的 奇偶 校 验 位 
使 码 字 中 1 的 数目 为 偶数 。 这 通常 是 通过 把 数据 字 的 4 位 加 起 来 ( 模 2 )， 结 果 就 是 奇偶 校 验 
位 ， 换 言 之 : 


ro=a3+a2z+al+ao ( 模 2) 





图 H-6 简单 奇偶 校 验 码 的 编码 器 和 译 码 器 


如 果 1 的 数目 为 偶数 ， 结 果 是 0 ; 如 果 1 的 数目 为 奇数 ， 结 果 是 1。 在 两 种 情况 下 ， 码 
字 中 1 的 总 数 都 是 偶数 。 

发 送 者 发 送 码 字 ， 该 码 字 在 传输 过 程 可 能 会 受到 损坏 。 接 收 者 收 到 一 个 5 位 的 字 ， 接 收 
者 中 的 检查 器 与 发 送 者 中 的 生成 器 做 同样 的 事情 ， 唯 一 不 同 的 是 : 加 法 是 在 5 位 上 进行 ， 结 
果 是 1 位 ， 称 为 校正 子 。 当 接收 的 码 字 中 1 的 数目 是 偶数 时 ， 校 正 子 为 0; 否则 为 1。 


So=b3+b2+bi+bot+qo ( 模 2) 


校正 子 是 检查 过 程 的 输出 ， 它 被 送 到 接收 者 的 决策 逻辑 中 ， 以 决定 对 码 字 中 的 数据 部 分 
如 何 处 理 。 决 定 可 以 是 接受 、 丢 奔 或 接受 前 进行 修改 (校正 编码 )。 在 这 种 情况 下 ， 校 正 子 
被 传送 给 决策 逻辑 分 析 器 ( decision logic analyzer)。 如 果 码 字 中 没有 误差 ， 校 正 子 为 0， 决 
策 逻 辑 接 受 码 字 中 的 数据 部 分 为 实际 的 数据 字 。 如 果 校 正 子 为 1， 在 码 字 中 一 定 有 误差 ， 所 
以 决策 逻辑 丢弃 码 字 的 数据 部 分 ， 数 据 字 没有 创建 。 

例 H.5 让 我 们 看 一 些 传输 场景 。 假 定 发 送 者 发 送 的 数据 字 是 1011， 奇偶 检验 位 是 
(1+0+1+1) mod 2=1， 它 被 加 到 数据 字 的 右边 ， 因 此 ， 从 数据 字 创 建 的 码 字 为 10111， 它 被 
发 送 给 接收 者 。 我 们 检查 下 列 5 种 情况 : 

1 ) 无 误差 发 生 ， 接 收 的 码 字 为 10111， 校 正 子 是 0， 数 据 字 1011 被 创建 。 

2 ) 发 生 单个 位 误差 .改变 了 a， 接收 的 码 字 为 10011， 校 正 子 为 1!1， 数 据 字 没 有 创建 。 

3 ) 单个 位 误差 发 生 ， 改 变 了 奇偶 校 验 位 m， 接 收 的 码 字 为 10110， 校 正 为 1， 数 据 字 没 
有 创建 。 注 意 ， 由 于 编码 不 够 复杂 ， 不 能 显示 出 损坏 位 的 位 置 ， 所 以 虽然 数据 字 中 的 位 没有 
损坏 ,但 数据 字 还 是 没有 创建 。 

4 ) 一 个 误差 改变 了 ro， 又 一 个 误差 改变 了 a3， 接收 的 码 字 为 00110。 校 正 子 是 0， 数 据 
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字 0011 在 接收 者 中 被 创建 。 注 意 ， 这 里 由 于 校正 子 的 值 ， 数 据 字 被 错误 地 创建 了 。 简 单 奇 
偶 校 验 译 码 器 不 能 检测 出 偶数 个 误差 。 误 差 互相 抵消 ， 给 出 的 校正 子 为 0。 
5 ) 三 位 (a3，a2 和 al ) 由 于 误差 发 生 了 改变 ， 接 收 到 的 码 字 为 01011。 校 正 子 为 1， 数 
据 字 没有 创建 。 这 表明 简单 奇偶 校 验 能 保证 检测 出 单个 误差 ， 也 能 检测 出 任何 奇数 个 误差 。 
简单 奇偶 校 验 码 能 检测 出 奇数 个 误差 。 


2. 汉 明 码 
汉 明 码 是 线性 块 编码 的 子 集 ， 遵 循 下 列 两 个 准则 : 
n=k+ 工 和 n=2-1 


其 中 是 数据 字 中 的 位 数 ,r 是 宛 余 位 的 数目 ,n 是 码 字 中 的 位 数 。 这 种 编码 能 检测 出 多 达 r-1 
位 的 误差 ， 并 能 校正 多 达 (r-1)/2 位 的 误差 。 

例 H.6 一 个 编码 (k=4, r=3 和 n=7) 满足 汉 明 码 的 两 个 条 件 ， 因 为 有 7=4+3 和 
7=2-1。 这 种 编码 能 检测 出 (3-1)=2 位 的 误差 ， 并 能 校正 (3-1)/2=1 位 的 误差 。 

汉 明 码 的 理论 超出 了 本 书 的 范围 。 更 多 相关 信息 ， 请 参阅 Data Communication and Net- 
working, Behrouz Forouzan, McGraw-Hill, New York, 2006。 下 一 节 讨 论 汉 明码 的 一 个 子 集 ， 
称 为 循环 码 。 


H.4 循环 码 


循环 码 是 具有 额外 特性 的 特殊 线性 块 编码 。 在 循环 码 中 ， 如 果 码 字 被 循环 移 位 (旋转 )， 
则 结果 是 另 一 个 码 字 。 例 如 ， 如 果 1011000 是 一 码 字 ,我 们 循环 左 移 它 ， 那 么 0110001 也 是 
一 个 码 字 。 


H.4.1 循环 元 余 检 验 


我 们 可 以 创建 循环 码 来 校正 误差 。 但 是 ， 所 需要 的 理论 背景 超出 了 本 附录 的 范围 。 这 里 
仅 简 单 地 讨论 一 类 称 为 循环 元 余 校 验 (CRC) 的 循环 码 ， 它 用 在 像 LAN 和 WAN 这 样 的 网 
络 中 。 

表 H-4 显示 了 一 个 CRC 码 的 例子 。 我 们 可 以 看 到 这 个 编码 的 线性 特性 和 循环 特性 。 


表 H-4 CRC 码 , k=4,， n=7 和 r=3 


图 H-7 显示 了 编码 器 和 译 码 器 一 种 可 能 设计 。 
在 图 H-7 的 编码 器 中 ， 数 据 字 有 位 (这 里 是 4), 码 字 有 nn 位 (这 里 是 7)。 通 过 在 字 
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的 右边 加 n-k (这 里 是 3 ) 个 0， 数据 字 的 大 小 扩展 。 这 n 位 结果 被 送 入 生成 器 中 。 生 成 器 使 
用 预先 定义 的 除数 ， 大 小 为 n-kt1 (这 里 是 4)。 生 成 器 使 用 模 2 除法 把 扩展 的 数据 字 除 以 除 
创建 了 码 字 。 


数 ， 商 被 丢弃 ， 余 数 (mriro ) 被 加 到 数据 字 中 ， 








图 H-7 CRC 编码 器 和 译 码 器 


译 码 器 接收 到 码 字 ， 它 可 能 损坏 ， 所 有 n 位 的 一 个 副本 被 送 入 检查 器 中 ,检查 器 是 生成 
器 的 一 个 复制 品 。 检 查 器 产生 的 余数 是 一 个 n-k (这 里 是 3 ) 位 的 校正 子 ， 它 被 送 入 决策 逻 
辑 分 析 器 中 。 分 析 器 具有 简单 的 功能 : 如 果 校 正 子 全 为 0， 则 码 字 的 最 左 4 位 被 接受 为 数据 


字 (解释 为 无 误差 )， 否 则 ，4 位 被 丢弃 (误差 )。 


1. 编码 器 


让 我 们 更 仔细 地 看 一 下 编码 器 。 编 码 器 取 数 据 字 ， 并 用 n-k 个 0 扩展 它 ， 然 后 把 扩展 的 


数据 字 除 以 除数 ， 如 图 H-8 所 示 。 

注意 ， 这 不 是 常规 的 二 进 制 除法 ， 显 然 
72 除 以 11 的 结果 不 是 商 为 10， 余 数 为 6。 这 
是 模 2 运算 中 的 二 进 制 除法 ， 在 附录 G 中 讨 
论 过 了 。 在 这 种 除法 中 ， 加 法 和 减法 是 相同 
的 (这 是 在 附录 E 中 讨论 的 异 或 运算 )， 这 意 
味 着 我 们 不 做 减法 ， 只 做 加 法 。 这 种 除法 的 
一 个 更 好 的 解释 是 把 二 进 制 字 看 成 只 带 有 模 2 
运算 中 的 0 或 1 系数 的 多 项 式 。 更 多 相关 信 
息 ， 我 们 建议 有 兴趣 的 读者 去 参考 有 限 域 理 
论 ( 伽 罗 瓦 域 ) 和 关于 误差 检测 和 校正 的 书 。 

在 每 一 步 中 ， 除 数 的 一 个 副本 与 被 除数 
的 4 位 进行 异 或 运算 ， 异 或 运算 的 结果 (余数 ) 
是 3 位 (在 这 种 情况 下 )， 在 一 个 额外 的 位 被 移 
下 来 ( 见 图 H-8 ) 形成 4 位 的 长 度 之 后 ， 被 下 
一 步 使 用 。 这 种 类 型 的 除法 中 有 一 个 重点 是 需 
要 我 们 记 住 的 ， 如 果 被 除数 (或 每 步 中 使 用 
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的 部 分 ) 的 最 左边 一 位 是 0， 商 中 相应 的 位 也 是 0。 

当 没 有 位 可 以 拉 下 来 时 ， 我 们 就 得 出 了 结果 。 三 位 余数 形成 了 检验 位 (x,, ri 和 ro)。 它 
们 被 追加 到 数据 字 上 就 形成 了 码 字 。 同 样 要 注意 的 是 : 我 们 对 商 没 有 兴趣 ， 在 循环 码 中 只 使 
用 余数 。 

2. 译 码 器 

码 字 在 传输 过 程 可 能 会 改变 。 译 码 器 做 与 编码 器 相同 的 除法 。 除 法 的 余数 是 校正 子 。 
如 果 校 正 子 全 为 0， 这 里 没有 误差 ， 数 据 字 从 接收 到 的 码 字 中 分 离 出 来 ， 并 被 接受 。 否 则 ， 
所 有 的 都 丢弃 。 图 H-9 显示 了 两 个 例子 。 左 图 显示 了 无 误差 发 生 时 校正 子 的 值 ， 校 正 子 为 
000。 右 图 显示 了 有 1 位 误差 发 生 的 情况 ， 校 正 子 不 是 全 0 ( 它 是 011 ) 。 
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图 H-9 两 种 情况 下 CRC 译 码 器 中 的 除法 
3. 除数 
读者 可 能 会 疑惑 除数 1011 是 如 何 选择 的 。 这 需要 抽象 代数 和 有 限 域 理论 来 解释 ， 请 读 
者 参阅 相关 的 书籍 。 
H.4.2 ”循环 码 的 性 能 
我 们 已 经 看 到 循环 码 在 检测 单位 误差 、 双 位 误差 、 奇 数 个 误差 和 区 间 误 差 方 面具 有 很 好 
的 性 能 。 它 们 很 容易 在 硬件 和 软件 上 实现 ， 当 用 硬件 实现 时 ， 其 速度 特别 快 。 这 些 使 得 循环 
码 成 为 许多 网 络 的 良好 选择 。 


H.5 校 验 和 

我 们 讨论 的 最 后 一 种 误差 检测 方法 是 校 验 和 ( checksum )。 校 验 和 被 几 种 协议 在 因特网 
中 使 用 。 像 线性 编码 和 循环 码 一 样 ， 校 验 和 也 是 基于 宛 余 (redundancy) 概念 的 。 
H.5.1 校 验 和 概念 


校 验 和 的 概念 并 不 难 ， 下 面 用 几 个 例子 来 说 明 。 
例 H.7 假设 数据 是 5 个 4 位 的 数字 ， 我 们 要 把 它们 送 到 某 个 目的 地 。 除 了 发 送 这 些 数 
据 外 ， 还 发 送 这 些 数字 的 和 。 人 例如， 如果 数字 集 是 (7，11，12，0，6 )， 发 送 (7，11，12， 
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0，6，36 )， 这 里 36 是 原始 数字 之 和 。 接 收 者 把 5 个 数字 相 加 ， 并 把 结果 与 和 作 比 较 ， 如 果 
两 者 相同 ， 接 收 者 假定 无 误差 ， 接 受 这 5 个 数字 ， 丢 弃 和 ; 否则 ， 某 个 地 方 有 误差 发 生 ， 数 
据 则 不 被 接受 。 

例 H.8 如 果 发 送 和 的 负数 ， 称 为 检验 和 (checksum)， 这 样 使 得 接收 者 的 工作 更 为 容 


易 。 在 以 上 例子 中 ,发 送 (7，11，12，0，6，-36 )。 接 收 者 把 接收 的 数字 全 部 相 加 (包括 
检验 和 )， 如 果 结 果 为 0， 就 假定 无 误差 ， 否 则 有 误差 。 
H.5.2 求 反 


先前 的 例子 中 有 一 个 重要 的 缺陷 。 除 校 验 和 之 外 ， 数 据 都 是 4 位 的 字 (它们 都 小 于 15 )， 
一 个 解决 方法 就 是 使 用 求 反 运算 (第 3 章 所 讨论 的 )。 
例 H.9 下 面 用 求 反 运算 把 例 H.8 再 做 一 遍 。 图 H-10 显示 了 发 送 者 和 接收 者 的 处 理 过 程 。 


发 送 者 位 置 接收 者 位 置 





卷 绕 和 求 补 的 细节 卷 绕 和 求 补 的 细节 
图 H-10 例 H.7 


发 送 者 把 校 验 和 初始 化 为 0， 把 所 有 的 数据 项 和 校 验 和 相 加 ( 校 验 和 被 看 成 一 个 数据 
项 )， 结 果 是 36, 但 是 36 不 能 用 4 位 表示 。 多 余 的 两 位 被 卷 绕 ， 与 和 相 加 ， 形 成 了 卷 绕 
和 ， 值 为 6。 在 图 中 ,我 们 显示 了 以 二 进 制 表示 的 细节 。 和 然后 被 求 补 ， 得 到 校 验 和 ， 值 为 
9(15-6=9)。 现 在 发 送 者 发 送 6 个 数据 项 给 接收 者 ， 其 中 包括 检验 和 9。 接收 者 遵循 与 发 送 
者 相同 的 处 理 过 程 ， 把 所 有 数据 相 加 (包括 校 验 和 )， 结 果 是 45。 和 被 卷 绕 ， 变 成 15， 卷 绕 
和 被 求 补 ， 变 成 了 0。 由 于 校 验 和 的 值 为 0， 意 味 着 数据 未 受到 损坏 。 接 收 者 丢弃 校 验 和 ， 
保存 其 他 的 数据 项 ; 如 果 校 验 和 非 0， 整 个 数据 包 被 丢弃 ， 必 须 再 次 发 送 。 


H.5.3 因特网 校 验 和 


通常 ， 因 特 网 (IP 协议 ) 使 用 16 位 校 验 和 。 发 送 者 和 接收 者 使 用 如 下 程序 : 
1. 发 送 者 一 边 

e 16 位 的 校 验 和 置 为 0， 加 到 信息 上 去 ; 

e 新 的 信息 被 分 成 16 位 的 字 ; 

e@ 用 反 码 加 法 把 所 有 字 加 起 来 ; 

e 和 被 求 补 ， 替 代 原 先 的 校 验 和 。 

2. 接收 者 一 边 

@ 把 接收 到 的 信息 (包括 校 验 和 ) 分 成 16 位 的 字 ; 
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e 使 用 反 码 加 法 把 所 有 字 加 起 来 ; 

e 和 被 求 补 ; 

e 如 果 求 补 后 的 和 是 0， 信 息 就 被 接受 ， 和 否则 ， 被 拒绝 。 

例 H.10 计算 一 个 8 个 字符 的 文本 字 (“Forouzan”) 的 校 验 和 ， 如 图 H-11 所 示 。 





b) 接收 端的 校 验 和 
图 H-11 计算 校 验 和 的 一 个 例子 


文本 需要 划分 成 2 字 节 (16 位) 的 字 。 我 们 使 用 ASCII 码 (参见 附录 A) 把 每 个 字 节 变 
成 两 个 十 六 进 制 的 数字 。 例 如 ,“F ”被 表示 成 (46)ik,“o” 被 表示 成 (6F)16。 在 图 H-11a 中 ， 
第 一 列 的 部 分 和 为 (36)ie， 我 们 保留 最 右边 的 数字 (6 )， 把 最 左边 的 数字 (3 ) 作为 进位 插 
到 第 二 列 中 。 每 一 列 重 复 这 个 过 程 ， 校 验 和 就 被 计算 出 来 ， 和 数据 一 起 发 送 到 接收 者 。 接 
收 者 进行 同样 的 操作 ， 如 图 H-11b 所 示 。 如 果 有 任何 损坏 ， 接 收 者 重新 计算 的 校 验 和 就 不 
是 全 0。 

3. 性 能 

传统 的 校 验 和 使 用 一 个 小 的 位 数 ( 16 )， 去 检测 任何 大 小 信息 (有 时 是 几 千 位 ) 中 的 误 
差 。 但 是 ， 在 误差 检测 能 力 方面 ， 这 种 方法 没有 CRC 那样 强壮 。 例 如 ， 假 设 一 个 字 的 值 增 
加 了 ， 而 另 一 个 字 的 值 减 少 了 相同 的 值 。 因 为 和 与 检验 和 仍然 是 相同 的 ， 所 以 两 个 误差 就 
不 能 检测 出 来 。 同 样 ， 如 果 几 个 字 的 值 都 增加 了 ， 但 总 共 的 变化 是 65 535 ( 2!-1 ) 的 倍数 ， 
和 与 检验 和 仍然 是 相同 的 ， 误 差 仍 检 测 不 出 来 。 


缩 略 语 


ADT: abstract data type ， 抽 象 数 据 类 型 

AES: advanced encryption standard， 高 级 加 密 标准 

ALU: arithmetic logic unit， 算 术 逻 辑 单元 

ANSI: American national standardsinstitute， 美 国 国家 标准 协会 

ASCII: American standard code for information interchange， 美 国信 息 交 换 标准 码 

B-frame: bidirectional ffame， 双 向 帧 

bit: binaryal digit， 人 位， 二进制 数 

BST: binary search tree， 二 叉 搜索 树 

CA : certification authority， 认 证 机 构 

CD-R: compact disc recordable， 可 刻录 光盘 

CD-ROM: compact disc read-only memory， 只 读 光盘 

CD-RW: compact disc rewritable， 可 重 写 光盘 

CGI: common gateway interface， 通 用 网 关 接 口 

CISC: complex instruction set computer， 复 杂 指 令 集 计算 机 

COBOL: common business-oriented language， 面 向 商业 的 通用 语言 

CPU : central processing unit， 中 央 处 理 器 

DBMS : database management system， 数 据 库 管理 系统 

DCT: discrete cosine transform， 离 散 余 弦 变 换 

DES: data encryption standard， 数 据 加 密 标准 

digraph: directed graph， 有 向 图 

DMA: direct memory access， 直 接 存储 器 存 取 

DRAM: dynamic RAM， 动 态 随机 存 取 存 储 器 

DVD: digital versatile disk， 数 字 多 功能 光盘 

EBCDIC: extended binarycoded decimal interchange code， 扩 展 的 二 进 制 编码 的 十 进 制 交 换 码 

EEPROM : electronically erasable programmable read-only memory， 电 可 擦 除 可 编程 只 读 存 
储 器 

EPROM : erasable programmable read-only memory， 可 擦 除 可 编程 只 读 存储 器 

E-R: entity-relation， 实 体 - 关系 

FIFO : first-in first-out， 先 进 先 出 

FORTRAN: FORmula TRANslation， 公 式 翻 译 程序 语言 

FTP: file transfer protocol， 文 件 传输 协议 

GIF :graphical interchange format， 图 形 交 换 格式 

GUI: graphical user interface， 图 形 用 户 接口 

HTML : hypertext markup language， 超 文本 标记 语言 
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HTTP: hypertext transfer protocol， 超 文本 传输 协议 

I-frame: intracoded frame， 内 部 编码 帧 

IMAP: Internet mail access protocol， 互 联网 邮件 访问 协议 

IP: Internet protocol， 网 际 协议 

ISO : international organization for standardization ， 国 际 标准 化 组 织 

ISP: Internet service provider， 互 联网 服务 提供 商 

JPEG: joint photographic experts group， 联 合 图 像 专家 组 

KDC: key distribution center， 密 钥 分 发 中 心 

LAN: local area network， 局 域 网 

LIFO: last-in, first-out， 后 进 先 出 

LZ: LempelZiv，LZ 压缩 算法 

LZW: Lempel Ziv Welch，LZW 压缩 算法 

MAC : media access control，or message authentication code， 媒 体 访问 控制 或 信息 身份 验证 
代码 

MAN: metropolitan area network， 城 域 网 

MIME: multipurpose Internet mail extension ， 多 用 途 的 互联 网 邮件 扩充 协议 

MP3: MPEG audio layer 3，MPEG 第 三 代 音 频 压 缩 格式 

MPEG: motion picture experts group ， 运 动 图 像 专家 组 

MS-DOS: microsoft disk operating systetm， 微 软磁盘 操作 系统 

MTA : message transfer agent， 消 息 传送 代理 

NF: normal form， 范 式 

NTFS: NT file system，NT 文件 系统 

P-frame: predicted frame， 预 测 帧 

POP: post office protocol， 邮 局 协议 

PROM: programmable read-only memory， 可 编程 只 读 存 储 器 

RAM: random access memory， 随 机 存储 器 

RDBMS: relational database management system， 关 系数 据 库 管理 系统 

RGB: red，green，blue， 红 ， 绿 ， 蓝 

RISC: reduced instruction set computer， 精 简 指 令 集 计算 机 

ROM: read-only memory， 只 读 存 储 器 

RSA : Rivest- Shamir-Adelman，RSA 加 密 算法 ， 该 算法 由 Rivest、Shamir 和 Adelman 在 
1978 年 提出 

SCSI: small computer system interface ， 小 型 计算 机 系统 接口 

SCTP :， stream control transmission protocol， 流 控制 传输 协议 

SMTP: simple mail transfer protocol， 简 单 邮件 传输 协议 

SQL: structured query language， 结 构 化 查询 语言 

SRAM: static RAM， 静 态 随机 存储 器 

TCP: transmission control protoco1l， 传 输 控 制 协议 

TCP/IP: transmission control protocol/internet protocol， 传 输 控 制 协议 / 网 际 协议 

TELNET: terminal network， 终端 网 络 
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UDP: user datagram protocol， 用 户 数 据 报 协 议 
UML: unified modeling language， 统 一 建 模 语言 
URL: uniform resource locator， 统 一 资源 定位 器 
USB :universal serial bus， 通 用 串 行 总 线 

WAN: wide area network， 广 域 网 

WORM: write once，read many， 写 一 次 ， 读 多 次 
WWW: world wide web， 万 维 网 

XML : extensible markup language， 可 扩展 标记 语言 
XOR: exclusive OR， 异 或 


术 语 表 


absolute pathname (绝对 路 径 名 ) 在 UNIX 或 Linux 系统 中 ， 一 条 从 根 开 始 的 路 径 名 。 

abstract data type ( ADT) (抽象 数据 类 型 ) 一 种 数据 类 型 以 及 定义 在 该 数据 类 型 上 有 意义 
的 一 组 操作 。 

access method ( 存 取 方法 ) 从 二 级 (辅助 ) 存储 设备 读 取 数据 的 技术 。 

active document (活动 文档 ) 在 万 维 网 中 使 用 Java 并 在 本 地 站 点 上 运行 的 文档 。 

actual parameters (实际 参数 ) 在 函数 调用 语句 中 的 参数 ,该 参数 包含 传送 给 函数 的 值 ， 
与 形式 参数 相对 应 。 

Ada (Ada 语言 ) 由 美国 国防 部 研制 开发 的 高 级 并 发 编程 语言 。 

address bus (地 址 总 线 ) 系统 总 线 中 用 于 地 址 传输 的 部 分 。 

address space (地 址 空间 ) 地 址 的 范围 。 

advanced encryption standard (AES) 一 种 使 用 一 块 (512 字 节 ) 大 小 和 128 位 密 钥 的 对 
称 密 钥 块 密码 。 

algorithm (算法 ) 用 计算 机 解决 问题 的 逻辑 步骤 

American national standards institute ( ANSI) (美国 国家 标准 协会 ) 一 个 负责 创建 编程 语 
言 、 电 气 规 范 、 通 信 协 议 等 标准 的 组 织 。 

American standard code for infor-mation interchange ( ASCII) (美国 信息 交换 标准 码 ) 一 
种 用 128 个 数值 来 定义 控制 和 印刷 字符 的 编码 方案 。 

analog (模拟 量 ) 连续 变化 的 实体 。 

analysis phase (分 析 阶 段 ) 软件 系统 生命 周期 的 一 个 阶段 ， 用 于 定义 要 完成 的 既定 目标 的 
需求 。 

ancestor (祖先 ) 从 一 个 树 的 当前 节点 到 根 路 径 上 的 任何 节点 。 

AND operation (与 运算 ) 位 级 别 的 运算 之 一 。 仅 当 所 有 位 都 是 1 时 ， 该 运算 结果 是 1， 否 
则 为 0。 

applet (小 程序 ) 一 种 用 Java 语言 编写 的 创建 活动 Web 文档 的 计算 机 程序 。 

application layer (应 用 层 ) TCP/IP 模型 的 第 7 层 ， 提 供 访问 网 络 服务 。 

arc ( 弧 ) 图 中 的 定向 线段 。 和 边 相 对 。 

arithmetic logic unit (ALU)( 算 术 逻 辑 单 元 ) 计算 机 系统 中 用 于 执行 数据 的 算术 和 逻辑 运算 
的 部 分 。 

arithmetic operation (算术 运算 ) 取 两 个 数 生成 另 一 个 数 的 运算 。 

arithmetic operator (算术 运算 符 ) 用 于 算术 运算 的 运算 符 。 

arithmetic shift operation (算术 移 位 运算 ) 一 种 数字 符号 被 保留 的 移 位 运算 。 

array (数组 ) 一 个 大 小 固定 ， 有 序 的 相同 数据 类 型 的 集合 。 

artificial intelligece (人 工 智能 ) 模仿 人 类 思维 的 计算 机 系统 研究 。 

assembler (汇编 程序 ) 将 源 程序 转变 成 可 执行 对 象 代码 的 系统 软件 ,传统 上 和 汇编 语言 程 
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序 相 关 。 参 见 compiler。 

assignment statement (赋值 语句 ) 将 值 赋 给 变量 的 语句 。 

assembly language (汇编 语言 ) 一 种 编程 语言 ， 其 中 在 计算 机 机 器 语言 和 该 语言 的 符号 指 
令 集 之 间 有 一 对 一 的 通信 。 

asymmetric-key cipher ( 非 对 称 密 钥 密码 ) 密码 术 的 一 种 ， 它 使 用 两 个 不 同 的 密 钥 ， 公 和 钼 用 
来 加 密 ， 私 钥 用 来 解密 。 

asymmetric-key encryption ( 非 对称 密 钥 密 码 学 ) 用 公 钥 加 密 。 

attribute (属性 ) 在 关系 数据 库 中 ， 一 个 关系 中 的 每 一 列 。 

audio (音频 ) 声音 或 音乐 的 记录 或 传输 。 

authentication (验证 ， 认 证 ) 消息 发 送 者 的 身份 验证 。 

auxiliary storage (辅助 存储 设备 ) 主 存储 器 以 外 的 任何 存储 设备 ; 永久 数据 存储 设备 ; 外 
存储 器 ; 二 级 存储 器 。 

availability (可 用 性 ) 信息 安全 的 构件 ， 它 要 求 组 织 创建 和 存储 的 信息 对 授权 实体 是 可 用 的 。 

axon ( 轴 突 ) 人 体 神经 的 一 部 分 ， 它 通过 神经 键 向 其 他 神经 提供 输出 。 

basis path testing (基本 路 径 测试 ) 白 盒 测 试 法 ,创建 一 套 测试 用 例 ， 执 行 软件 中 的 每 条 
语句 至 少 一 次 。 

batch operating system( 批 处 理 操作 系统 ) 早期 计算 机 使 用 的 操作 系统 ， 其 任务 在 被 服务 
之 前 是 分 组 的 。 

bidirectional frame (B-frame) (双向 帧 ) 用 于 表示 在 MPEG 中 和 前 后 帧 相关 的 帧 。 

big-O notation (大 O 表示 法 ) 一 种 算法 效率 的 测量 ， 这 种 方法 仅 考 虑 主导 因素 。 

binary digit (bit) 〈 二 进 制 数 ) 信息 的 最 小 单元 (0 或 1)。 

binary file (二 进 制 文件 ) 以 计算 机 内 部 格式 存储 的 数据 集合 。 相 对 于 文本 文件 。 

binary operation (二 元 操作 ) 需要 两 个 输入 操作 数 的 操作 。 

binary search ( 折 半 查找 ) 一 种 查找 算法 ， 通 过 重复 将 列表 对 半 划 分 查找 来 定位 数值 。 

binary search tree ( BST) (二 又 搜索 树 ) 一 棵 二 叉 树 ， 其 左 子 树 中 的 关键 字 值 都 小 于 根 的 关 
键 字 值 ， 右 子 树 中 的 关键 字 值 都 大 于 或 等 于 根 的 关键 字 值 ， 而 且 每 棵 子 树 也 是 二 又 搜索 树 。 

binary system (二 进 制 系统 ) 使 用 0 和 1 两 种 符号 的 编号 系统 。 

binary tree (二 又 树 ) 该 树 中 任 一 节点 要 么 没有 子 节点 ， 要 么 有 一 个 子 节点 ， 要 么 有 两 个 子 节点 。 

biometrics (生物 测定 学 ) 标识 某 人 的 生理 或 行为 特性 测量 。 

bit (位 ) 二 进 制 数 字 的 首 字母 缩写 。 在 计算 机 中 ， 值 为 0 或 1 的 基本 存储 单位 。 

bit depth (位 深度 ) 在 样本 过 程 中 表示 样本 的 位 的 数目 。 

bit pattern (位 模式 ) 0 和 1 组 成 的 位 序列 。 

bit rate (比特 率 ) 每 秒 钟 传输 的 位 的 数目 。 

bitmap graphic (位 图 图 像 ) 用 像素 定义 图 形 的 图 像 表 示 法 。 

black-box testing ( 黑 盒 测试 ) 基于 系统 需求 而 不 是 基于 程序 知识 的 测试 。 

boolean algebra (布尔 代数 ) 操纵 只 有 真 、 假 值 的 对 象 (布尔 对 象 ) 的 代数 。 

bootstrap( 自 举 ) 当 计 算 机 开机 时 ， 把 操纵 系统 装载 到 主 内 存 的 过 程 。 

breadth-first traversal (广度 优先 遍历 ) 一 种 图 的 遍历 方法 ， 在 该 方法 中 当前 处 理 节点 的 
邻 节点 的 处 理 要 优先 于 其 子 节点 。 

browser (浏览 器 ) 显示 万 维 网 文件 (网 页 ) 的 应 用 程序 。 
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brute-force search (盲目 查找 ) 一 种 检查 树 中 每 条 路 径 ， 直 至 发 现 目标 的 查找 方法 。 

bubble sort ( 冒 泡 排 序 ) 一 种 排序 算法 ,算法 每 轮 将 最 小 的 数 移动 至 未 排序 部 分 的 首位 。 

bucket ( 桶 ) 在 散 列 算法 中 ， 一 种 可 用 于 放置 多 个 数据 单元 的 特定 区 域 。 

bucket hashing ( 桶 散 列 法 ) 一 种 使 用 桶 减少 冲突 的 散 列 算法 。 

bus (总 线 ) 计算 机 中 连接 不 同 硬件 部 分 的 物理 通道 ; 通过 总 线 拓扑 结构 使 用 共享 的 物理 介质 。 

bus topology (总 线 拓扑 结构 ) 一 种 网 络 拓扑 结构 ， 所 有 的 计算 机 连接 在 一 个 共享 的 介质 上 。 

byte ( 字 节 ) 一 种 存储 单位 ， 通 常 为 8 位 。 

bytecode ( 字 节 码 ) 一 种 机 器 语言 ， 在 其 中 Java 源 程 序 被 编译 。 

Clanguage (C 语言 ) 一 种 由 Dennis Ritchie 开发 的 过 程 化 编程 语言 。 

C++ language (C++ 语言 ) 由 Bjarne Stroustrup 开发 的 面向 对 象 的 编程 语言 。 

cache memory (高 速 缓冲 存储 器 ) 用 于 保存 当前 正在 处 理 的 数据 项 的 小 型 快速 存储 器 。 

Caesar cipher (凯撒 密码 ) 由 尤 利 乌 斯 . 凯撒 使 用 的 移 位 密码 。 

central processing unit (CPU) (中 央 处 理 单元 ) 计算 机 中 包含 的 用 于 解释 指令 的 控制 部 件 ， 
在 个 人 计算 机 中 则 是 指 一 个 包含 控制 单元 和 算术 逻辑 单元 的 微 处 理 器 。 

certification authority (CA) (认证 机 构 ) 把 公 钥 和 实体 捆绑 在 一 起 ， 且 解决 身份 验证 的 组 织 。 

chatting (聊天 ) 一 种 互联 网 上 有 用 的 应 用 程序 。 

child ( 子 节点 ) 在 树 或 图 中 拥有 祖先 的 节点 。 

Church-Turing thesis (乔治 - 图 灵 理 论 ) 在 计算 理论 中 ， 一 个 关于 使 用 递归 (乔治 理论 ) 
和 机 械 设 备 的 可 计算 函数 的 本 质 等 价 于 一 台 图 灵机 的 复合 假设 。 

cipher (密码 ) 一 种 加 密 解密 算法 。 

ciphertext ( 密 文 ) 加 密 数据 。 

circular shift operation (循环 移 位 运算 ) 一 种 把 从 二 进 制 字 一 端 移 出 的 位 搬入 字 的 另 一 端 
的 移 位 运算 。 

circular waiting (循环 等 待 ) 在 操作 系统 中 ， 所 有 涉及 的 进程 和 资源 形成 了 一 个 循环 。 这 种 
情景 称 为 循环 等 待 。 

class (类 ) 一 种 将 数据 和 函数 结合 在 一 起 的 类 型 。 

class diagram (类 图 ) 在 面向 对 象 程序 设计 中 表示 各 对 象 之 间 关 系 的 图 。 

class diagram (类 图 ) 在 一 个 系统 中 表明 类 之 间 关 系 的 图 。 

client-server architecture (客户 机 - 服务 器 体系 结构 ) 在 两 个 应 用 程序 中 交互 的 模型 ， 其 
中 一 端 (客户 端 ) 向 另 一 端 (服务 器 ) 申请 服务 。 

code (代码 ) 设计 成 表示 文本 符号 的 一 组 位 模式 集合 。 

code generator (代码 生成 器 ) 在 编译 程序 或 解释 程序 中 生成 机 器 语言 代码 的 程序 。 

cohesion (内 聚 ) 模块 的 一 种 属性 ， 该 属性 用 于 描述 一 个 过 程 内 部 各 个 模块 之 间 的 相关 程度 。 

cold fusion ( 冷 聚 变 ) 一 种 动态 Web 技术 ， 人 允许 数据 项 的 聚变 来 自 于 常规 数据 库 。 

collision (冲突 ) 在 散 列 中 ， 当 散 列 算法 为 一 个 关键 字 提供 的 地 址 已 经 被 占有 的 事件 。 

collision resolution (冲突 解决 法 ) 一 种 用 于 解决 散 列 算法 中 产生 冲突 事件 后 生成 其 他 地 址 
的 算法 。 

color depth (颜色 深度 ) 用 来 表示 像素 颜色 的 位 数 。 

column-major storage (以 列 为 主 序 的 存储 ) 一 种 二 维 数组 的 存储 方法 ， 数 组 中 的 元 素 是 一 
列 接 一 列 存放 的 。 
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common business-oriented langu-age ( COBOL) (面向 商业 的 通用 语言 ) 由 Grace Hopper 
开发 的 一 种 商业 编程 语言 。 

common gateway interface (CGI)( 通 用 网 关 接 口 ) 一 种 HTTP 服务 器 和 创建 动态 文档 可 执 
行程 序 间 的 通信 标准 。 

compact disc (光盘 ) 直接 访问 的 光 存 储 介质 。 

compact disc read-only memory ( CD-ROM ) (只 读 光 盘存 储 器 ) 一 种 数据 由 制造 商 写 人 而 
用 户 只 能 读 取 的 光盘 。 

compact disc recordable (CD-R) (可 刻录 光盘 ) 由 用 户 写 一 次 读 多 次 的 光盘 。 

compact disc rewritable (CD-RW) (可 重 写 光盘 ) 可 由 用 户 多 次 读 写 的 光盘 。 

compilation (编译 ) 在 执行 程序 之 前 ， 将 用 高 级 语言 所 编写 的 全 部 源 程序 翻译 成 机 器 语言 
的 过 程 。 

compiler (编译 器 ) 一 种 将 源 程序 转变 为 可 执行 代码 的 系统 软件 ， 通 常 与 高 层 语 言 相 关联 。 
参见 assembler。 

complex instruction set computer ( CISC) (复杂 指令 集 计 算 机 ) 一 种 定义 了 复杂 的 指令 系 
统 的 计算 机 ， 虽 然 其 中 的 一 些 指令 并 不 经 常用 到 。 

composite type (复合 数据 类 型 ) 由 两 种 或 两 种 以 上 简单 数据 类 型 组 成 的 一 种 数据 类 型 。 

compound statement (复合 语句 ) 在 一 些 编程 语言 中 ， 多 个 语句 (指令 ) 集合 被 当成 为 一 
条 指令 来 处 理 。 

computer language (计算 机 语言 ) 任何 一 种 依照 句法 的 可 用 来 编写 计算 机 程序 的 语言 ， 例 
如 ， 机 器 语言 、 汇 编 语言 、C、COBOL 和 FORTRAN。 

conceptual level (概念 层 ) 涉及 数据 库 的 逻辑 结构 。 它 只 与 数据 库 的 意义 有 关 ， 而 与 它 的 
物理 实现 有 关 。 . 

confidentiality (机 密 性 ) 一 个 安全 目标 ， 用 于 定义 对 非 授权 实体 隐藏 信息 的 过 程 。 

congestion control (拥塞 控制 ) 控制 过 多 网 络 或 互联 网 流量 而 引起 服务 质量 总 体 降 级 的 任 
何方 法 。 

connectionless protocol (无 连接 协议 ) 一 种 无 需 建立 连接 或 终止 连接 的 数据 传输 协议 。 

connection-oriented protocol (面向 连接 的 协议 ) 一 种 在 传输 数据 前 先 建立 连接 的 数据 传 
输 协 议 。 

constant (常量 ) 在 程序 运行 中 值 不 能 被 改变 的 数据 值 ， 与 变量 相对 。 

control bus (控制 总 线 ) 在 计算 机 各 组 件 间 传 递 信息 的 总 线 。 

control statement (控制 语句 ) 一 种 在 源 程序 中 改变 控制 顺序 流 的 语句 。 

control structure testing (控制 结构 测试 ) 一 种 白 盒 测试 方法 ， 使 用 不 同 的 测试 种 类 : 条 件 
测试 、 数 据 流 测试 和 循环 测试 。 

control unit (控制 单元 ) CPU 中 能 够 解释 指令 和 控制 数据 溢出 的 组 件 。 

controller (控制 器 ) 在 图 灵机 中 有 着 类 似 于 计算 机 的 CPU 作用 的 组 件 。 

coupling (耦合 ) 两 个 独立 函数 之 间 相 互 依赖 性 的 一 种 度量 。 参 见 content coupling、control 
coupling、data coupling、global coupling 和 stamp coupling。 

cryptographic hash function (加 密 的 散 列 函数 ) 一 种 由 信息 生成 信息 摘要 的 函数 。 

cryprography (密码 学 ) 一 门 通过 信息 转换 保证 信息 机 密 和 免 受 攻击 的 科学 和 艺术 。 

current directory (当前 目录 ) 在 UNIX 和 Linux 系统 中 ， 用 户 当前 所 在 的 目录 。 
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cycle( 环 路 ) 起 点 和 终点 为 同一 顶点 ， 长 度 大 于 1 的 图 的 路 径 。 

data bus (数据 总 线 ) 计算 机 内 用 来 在 部 件 间 传递 数据 的 总 线 。 

data compression (数据 压缩 ) 在 不 损失 有 意义 的 信息 的 情况 下 压缩 数据 量 。 

data confidentiality (数据 机 密 性 ) 一 种 安全 服务 ， 用 来 保护 数据 ， 防 止 泄露 攻击 、 嗅 探 和 
流量 分 析 。 

data encryption standard (DES) (数据 加 密 标 准 ) 美国 政府 用 于 非 军 队 和 非 机 密 情况 下 的 
加 密 方法 。 

data file (数据 文件 ) 只 存放 数据 不 存放 程序 的 文件 。 

data flow diagram (数据 流程 图 ) 一 种 显示 系统 中 数据 流动 的 图 。 

data integrity (数据 完整 性 ) 一 种 安全 服务 ， 用 来 保护 数据 ， 防 止 修改 、 插 和 人 入、 删除 和 重 放 。 

data link layer (数据 链 路 层 ) TCP/IP 数据 模型 中 的 第 二 层 ; 负责 点 对 点 的 数据 传输 。 

data link layer address (数据 链 路 层 地 址 ) 用 在 数据 链 路 层 的 地 址 ， 有 时 称 为 MAC 地 址 ， 
有 时 称 为 物理 地 址 。 

data processor (数据 处 理 器 ) 用 来 输入 、 处 理 数据 并 输出 结果 的 实体 。 

data structure (数据 结构 ) 符合 一 定 句 法 的 数据 表示 形式 ， 这 种 数据 组 织 形式 可 以 显示 个 
体 元 素 之 间 的 关系 。 

data type (数据 类 型 ) 一 组 命名 的 数值 集合 以 及 用 于 控制 它们 的 操作 ， 如 字符 型 和 整 型 。 

database (数据 库 ) 有 组 织 的 信息 的 一 个 集合 。 

database management system (DBMS )( 数 据 库 管理 系统 ) 处 理 数据 库 的 一 个 或 一 套 程序 。 

database model (数据 库 模 型 ) 定义 数据 逻辑 设计 的 一 种 模型 。 

datagram (数据 报 ) 由 IP 协议 传送 的 包 。 

data-link layer (数据 链 路 层 ) OSI 模型 中 的 第 二 层 ; 负责 点 对 点 的 数据 传输 。 

DC value (DC 值 ) 不 随时 间 变 化 的 值 。 

deadlock( 死 锁 ) 一 个 任务 的 资源 被 其 他 任务 占有 而 导致 不 能 完成 的 状态 。 

decimal digit (十 进 制 数 ) 十 进 制 系统 中 的 符号 。 

decimal system (十 进 制 系统 ) 使 用 10 个 符号 (0 ~ 9 ) 表述 数字 的 方法 。 

declarative language (声明 性 语言 ) 利用 逻辑 推理 原则 来 解答 查询 的 一 种 计算 机 语言 。 

declarative paradigm (声明 性 范式 ) 利用 逻辑 推理 原则 来 解答 查询 的 范式 。 

decrement statement (递减 语句 ) 使 变量 的 值 减 1 的 语句 。 

decryption (解密 ) 将 原始 消息 从 加 密 数 据 中 恢复 。 参 见 encryption。 

default logic ( 缺 省 逻辑 ) 在 这 种 逻辑 中 ， 当 参数 的 缺 省 结论 与 知识 库 中 的 内 容 一 致 时 ， 则 
参数 的 缺 省 结论 被 接受 。 

delete operation (删除 操作 ) 在 关系 数据 库 中 ， 此 操作 删除 关系 中 的 元 组 。 

demand paging (请 求 分 页 调度 ) 一 种 当 程序 的 某 页 仅 在 需要 时 才 载 人 内 存 的 内 存 分 配方 法 。 

demand paging and segmentation (请 求 分 页 和 分 段 调度 ) 一 种 当 程 序 的 某 页 或 某 段 仅 在 
需要 时 才 被 载 人 内 存 的 内 存 分 配方 法 。 

demand segmentation (请 求 分 段 调度 ) 一 种 当 程 序 的 某 段 仅 在 需要 时 才 被 载 人 内 存 的 内 
存 分 配方 法 。 

demultiplexing ( 解 复 用 ) 分 开 复 用 的 数据 。 

dendrite ( 树 状 晶体 ) 神经 元 中 起 到 输入 设备 作用 的 那 部 分 。 
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denial of service (拒绝 服务 ) 对 安全 可 用 目标 的 唯一 攻击 ， 可 能 引起 系统 运行 变 缓 或 系统 
中 断 。 

depth-first traversal (深度 优先 遍历 ) ”在 访问 相 邻 节点 之 前 遍历 本 节点 所 有 的 子孙 的 遍历 方法 。 

dequeue (出 列 ) 在 队列 中 删除 一 个 元 素 。 

descendant (子孙 ) 当前 节点 通 向 叶子 路 径 上 的 任 一 节点 。 

design phase (设计 阶段 ) 软件 生命 周期 中 定义 如 何 实现 在 分 析 阶 段 中 提出 的 目标 的 阶段 。 

development process (开发 过 程 ) 创建 系统 生命 周期 之 外 的 软件 的 过 程 。 

device manager (设备 管理 器 ) 操作 系统 中 用 来 管理 输入 /输出 设备 的 组 件 。 

dictionary-based encoding (基于 字典 的 编码 ) 一 种 压缩 方法 ， 在 这 一 过 程 中 创建 一 个 字典 。 

difference operation ( 差 运 算 ) 两 个 集合 之 间 的 运算 。 结 果 为 第 一 个 集合 减 去 两 个 集合 中 
的 公共 元 素 ， 或 者 关系 数据 库 中 的 操作 符 ， 这 个 操作 符 应 用 于 两 个 有 着 相同 属性 的 关系 。 
结果 关系 中 的 值 是 存在 于 第 一 个 关系 而 不 存在 于 第 二 个 关系 中 的 值 组 。 

digit extraction method (数字 析 取 方法 ) 使 用 数字 析 取 的 散 列 方法 。 

digital (数字 的 ) 离散 ( 非 连续 的 ) 的 实体 。 

digital divide (数字 分 割 ) 把 人 分 成 两 组 的 社会 问题 : 一 组 与 其 他 社会 电子 相连 ， 而 另 一 组 
则 不 相连 。 

digital signature (数字 签名 ) 用 于 鉴别 消息 发 送 者 并 保护 数据 完整 性 的 一 种 方法 。 

digital versatile disk (DVD ) (数字 多 功能 光盘 ) 一 种 直接 访问 的 光 存 储 介质 。 

digraph (有 向 图 ) 一 种 有 方向 的 图 。 

direct hashing (直接 散 列 法 ) 一 种 无 需 算法 上 的 修改 就 可 获得 键 值 的 散 列 方法 。 

direct memory access (DMA) (直接 存储 器 存 取 ) 一 种 输入 /输出 形式 ， 通 过 特殊 的 设备 
控制 内 存 和 LO 设备 间 的 数据 交换 。 

directed graph (有 向 图 ) 在 线 ( 弧 ) 上 标明 方向 的 图 。 

directory (目录 ) 包含 文件 名 和 其 他 文件 地 址 的 文件 。 

discrete cosine transformation (DCT) (离散 余弦 变换 ) 用 于 JPEG 的 数学 变换 。 

distributed database (分 布 式 数据 库 ) 一 种 数据 库 ， 它 的 数据 分 别 存储 在 多 台 计 算 机 上 。 

distributed system (分 布 式 系统 ) 控制 的 资源 分 布 在 不 同 站 点 的 计算 机 上 的 操作 系统 。 

division remainder method (〈 除 余 法 ) 一 种 散 列 类 型 ， 它 的 键 值 除 以 一 个 数 且 余数 用 作 地 址 。 

domain name (域名 ) 在 DNS (域名 服务 器 ) 中 ， 用 点 分 隔 的 符号 序列 。 

domain name server (DNS) (域名 服务 器 ) 一 台 持 有 互联 网 域名 信息 的 计算 机 。 

dotted-decimal notation ( 带 点 的 十 进 制 标记 法 ) 为 使 IP 地 址 易 读 而 设计 的 一 种 标记 法 ; 
每 一 字 节 转换 为 十 进 制 数 ， 数 字 通 过 点 分 隔 开 。 

dynamic document (动态 文档 ) 一 种 由 在 服务 器 端 运行 的 程序 创建 的 Web 文档 。 

dynamic RAM (DRAM) (动态 RAM) 其 单元 使 用 电容 器 的 RAM，DRAM 必须 周期 性 地 
刷新 以 保持 其 数据 。 

edge ( 边 ) 没有 方向 的 图 的 连 线 。 

edge detection (边缘 检查 ) 一 种 查找 图 像 边 缘 的 图 像 处理 方 法 ， 通 过 颜色 上 和 文字 上 的 变 
化 来 审视 图 像 区 域 。 

electronic mail (email) (电子 邮件 ) 不 同 于 主机 对 主机 交换 方式 ， 而 是 基于 邮箱 地 址 的 一 种 
发 送 电子 消息 的 方法 。 
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electronically erasable programmable read-only memory (EEPROM) ( 电 可 擦 除 可 编程 只 读 
存储 器 ) 可 编程 的 只 读 存储 器 ， 它 可 以 使 用 电 脉 冲 编程 和 擦 除 ， 操 作 时 不 需要 从 计算 机 中 
移出 。 

encapsulation (封装 ) 一 种 软件 工程 设计 概念 ， 指 把 数据 和 操作 绑 定 且 独立 于 使 用 它们 应 
用 程序 。 

encryption (加 密 ) 将 信息 转 成 只 有 通过 解密 才 可 读 懂 的 格式 。 

enqueue (和信 列 ) 将 一 个 元 素 插 入 一 个 队列 。 

entity authentication (实体 身份 验证 ) 使 得 一 部 分 能 证 明 另 一 部 分 标识 的 一 种 技术 。 

entity relation (E-R) diagram (实体 -关系 (E-R) 图 ) 一 种 用 于 实体 - 关系 模型 的 图 。 

entity-relation ( E-R) mode (实体 - 关系 (E-R) 模型 ) 在 关系 数据 库 中 定义 实体 和 实体 间 
关系 的 一 种 模型 。 

erasable programmable read-only memory (EPROM )( 可 控 除 可 编程 只 读 存 储 器 ) 可 以 多 
次 擦 除 和 重 写 的 只 读 存储 器 ， 擦 除 EPROM 时 需要 从 计算 机 中 移出 。 

error report file (错误 报告 文件 ) 在 文件 更 新 过 程 中 ， 更 新 期 间 检测 到 错误 的 报告 。 

excess representation ( 余 码 表示 法 ) 一 种 数字 表示 方法 ， 用 于 存储 分 数 的 指数 值 。 

Excess_1023 ( 余 1023 码 ) 表示 浮 点 数 的 高 精度 的 IEEE 标准 。 

Excess_127 ( 余 127 码 ) 表示 浮 点 数 的 低 精度 的 IEEE 标准 。 

exclusive OR (XOR) ( 异 或 ) 一 种 二 进 制 逻辑 运算 ， 仅 当 操作 数 一 个 为 真 另 一 个 为 假 时 ， 
结果 为 真 。 

expert system (专家 系统 ) 一 种 系统 ， 该 系统 使 用 知识 表示 去 完成 通常 需要 人 类 专家 经 验 
的 任务 。 

expression (表达 式 ) 一 个 换算 成 单一 值 的 操作 数 和 操作 符 的 序列 。 

extended binary coded decimal interchange code ( EBCDIC ) (扩展 的 二 进 制 编码 的 十 进 
制 交换 码 ) 由 IBM 为 其 大 型 计算 机 系统 设计 的 字符 集 。 

extensible markup language ( XML ) (可 扩展 标记 语言 ) 一 种 允许 用 户 描述 文档 内 容 的 语 
言 。 在 面向 对 象 语言 中 ， 也 用 作 查 询 语言 。 

external level (外 层 ) ”数据 库 与 用 户 交 互 的 那 部 分 。 

fetch ( 取 (指令 )) 指令 周期 中 从 内 存 中 取出 用 来 执行 的 部 分 。 

field (字段 ) 数据 的 最 小 命名 单位 ， 该 数据 在 描述 信息 方面 有 含义 。 一 个 字段 可 能 是 一 个 变 
量 也 可 能 是 一 个 常量 。 

file transfer protocol ( FTP ) (文件 传输 协议 ) 一 种 TCP/IP 应 用 层 服务 ， 用 来 与 远程 站 点 间 
的 文件 传输 。 

firewire (火线 ) 一 种 输入 /输出 设备 控制 器 ， 带 有 可 传输 打包 数据 的 高 速 串 行 接口 。 

first in ，first out (FLFO ) (先进 先 出 ) 列表 中 先 添加 的 数据 项 先 移出 的 算法 。 

fixed-point representation (定点 表示 法 ) 计算 机 中 的 数字 表示 法 ， 小 数 点 的 位 置 是 固定 的 
(通常 在 最 左边 或 最 右边 ) 。 常 用 来 表示 整数 。 

floating-point representation ( 浮 点 表示 法 ) 计算 机 中 的 一 种 数字 表示 法 ， 为 得 到 更 高 的 精 
度 ， 小 数 点 的 位 置 是 浮动 的 ， 常 用 来 表示 计算 机 中 的 实数 。 

formal parameters (形式 参数 ) 在 函数 中 声明 的 参数 ， 用 于 描述 传 给 该 函数 的 数据 的 类 型 。 

FORmula TRANSslation (FORTRAN) 用 于 科学 和 工程 应 用 中 的 一 种 面向 过 程 的 高 级 语言 。 
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fragmented distributed database( 不 完全 分 布 式 数据 库 ) 一 种 数据 本 地 化 的 分 布 式 数据 库 。 

frame ( 帧 ) 数据 链 路 层 中 的 数据 单元 。 

frames (框架 ) 知识 表示 中 的 一 种 类 似 于 语义 网 的 表示 方法 。 

front (前 端 在 使 用 出 队列 操作 进行 删除 的 队列 中 的 下 一 个 元 素 。 

functional language (函数 型 语言 ) 一 种 程序 语言 ， 它 认为 程序 是 一 种 数学 函数 。 

functional paradigm (函数 范式 ) 一 种 范式 ， 在 其 中 程序 被 看 成 数学 函数 。 

general linear list (广义 线性 表 ) 一 个 可 以 在 任意 位 置 插入 或 删除 数据 的 表 。 

glass-box testing (玻璃 盒 测 试 ) 参见 white-box testing。 

Godel number (歌德 尔 数 ) 赋值 给 每 个 程序 使 用 的 数字 ， 可 以 在 具体 的 语言 中 编写 。 

graph (图 ) 称 为 项 点 的 节点 、 称 为 边 或 弧 的 线段 以 及 节点 连接 对 的 集合 。 

graphic interchange format (GIF ) (图 像 交换 格式 ) 一 个 每 个 像素 点 用 8 位 来 表示 的 位 图 图 像 。 

graphical user interface (GUI) (图 形 用 户 界面 ) 一 种 定义 了 图 标 和 图 标 上 操作 的 用 户 界 面 。 

halting problem (停机 问题 ) 编写 一 段 程序 测试 用 歌德 尔 数 表示 的 任何 程序 是 否 会 终止 。 

hardware (硬件 ) 计算 机 系统 中 的 物理 设备 ， 如 键盘 或 打印 机 。 

hashed file ( 散 列 文件 ) 使 用 某 一 散 列 算法 进行 查找 的 文件 。 

hashing method ( 散 列 方法 ) 存 取 散 列 文件 的 一 种 方法 。 

header ( 头 ) 在 路 由 或 其 他 的 用 途中 添加 至 包 开 始 部 分 的 信息 。 

heuristic search (启发 式 搜索 ) 使 用 规则 或 有 用 信息 提高 搜索 效率 的 一 种 搜索 方法 。 

hexadecimal digit (十 六 进 制 数 ) 十 六 进 制 系 统 中 的 符号 。 

hexadecimal system (十 六 进 制 系统 ) 十 六 进 制 系统 中 的 数字 ， 它 们 是 0、1、2、3、4、5、6、 
7、8、9、A、B、C、D、E 和 F。 

hierarchical model (层次 模型 ) 一 种 数据 库 模 型 ， 数 据 以 树 状 结构 组 织 ， 以 便 从 上 向 下 搜索 。 

high-level language (高 级 语言 ) 一 种 可 移植 的 编程 语言 ， 只 需要 程序 员 关 注 应 用 层面 而 非 
某 一 个 计算 机 或 操作 系统 的 结构 。 

high-order logic (高 阶 逻 辑 ) 一 种 扩展 了 谓词 逻辑 中 的 量词 YV 和 3 了 范围 的 逻辑 ， 此 逻辑 把 谓 
词 也 看 成 变量 。 

hold state (保持 状态 ) 任务 等 待 装 入 内 存 的 状态 。 

home address (内 部 地 址 ) 在 散 列 表 中 ， 由 散 列 算法 生成 的 首 地 址 。 

home directory ( 主 目录 ) 在 UNIX 或 Linux 中 ， 用户 首次 登录 后 所 处 在 的 目录 。 

home page (主页 ) 网 上 可 用 的 超 文本 文档 的 主页 面 。 

hub (集线器 ) 连接 一 个 网 络 中 其 他 设备 的 设备 。 

Huffman coding( 赫 夫 曼 编码 ) 一 种 使 用 可 变 长 度 码 的 统计 压缩 方法 。 

hypertext ( 超 文本 ) 带 有 其 他 文档 引用 链接 的 文档 。 

hypertext markup language (HTML )( 超 文本 标记 语言 ) 用 于 指定 Web 文档 的 内 容 和 格式 的 
计算 机 语言 ， 允 许 文 本 包含 字体 、 布 局 、 艇 人 图 形 以 及 链接 到 其 他 文档 。 

hypertext transfer protocol (HTTP )( 超 文本 传输 协议 ) 该 协议 用 于 在 互联 网 中 检索 Web 页 面 。 

identifier (标识 符 ) 在 编程 语言 中 给 一 个 对 象 的 名 称 。 

image processing (图 像 处 理 ) 人 工 智 能 的 一 个 研究 领域 ， 处 理 目标 的 感知 问题 一 一 智能 
主体 的 人 工 眼 睛 。 

imperative language (强制 性 语言 ) 过 程 化 语言 的 另 一 个 名 字 。 
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imperative paradigm (强制 性 范式 ) 过 程 化 范式 的 男 一 个 名 字 。 

implementation phase (实现 阶段 ) 软件 系统 生命 周期 中 创建 实际 程序 的 阶段 。 

increment statement (递增 语句 ) 在 C 或 C+t+ 中 ,给 整 型 数 的 值 加 1 的 语句 。 

incremental model ( 增 量 模型 ) 软件 工程 中 的 一 种 模型 。 该 模型 先 创建 整个 包 ， 不 过 包 的 
每 个 模块 仅 包含 一 个 空 膏 ， 然 后 随 着 该 包 的 多 次 反复 完善 ， 模 块 不 断 增加 复杂 性 。 

index (索引 ) 数组 中 元 素 的 地 址 。 

indexed color (索引 颜色 ) 光栅 图 像 中 的 一 种 技术 ， 只 使 用 真 彩 的 一 部 分 对 每 个 应 用 中 的 
颜色 进行 编码 。 

indexed file (索引 文件 ) 使 用 索引 来 完成 随机 存 取 的 文件 。 

infix( 中 缀 ) 一 个 放置 于 两 个 操作 数 之 间 的 算法 符号 。 

inheritance (继承 ) 通过 扩展 一 个 类 来 创造 一 个 新 类 的 能 力 ， 该 新 类 保持 基 类 的 数据 对 象 
和 方法 并 新 增 数据 对 象 和 方法 。 

inorder traversal (中 序 遍 历 ) 一 种 先 访问 左 子 树 ， 再 访问 根 ， 最 后 访问 右 子 树 的 二 又 树 的 
遍历 方法 。 

input data (输入 数据 ) 提交 给 计算 机 运行 一 个 程序 的 用 户 信 息 。 

input/output (MO) controller (输入 /输出 控制 器 ) 控制 访问 输入 /输出 设备 的 设备 。 

input/output subsystem (输入 /输出 子 系统 ) 在 计算 机 组 成 中 用 来 从 外 界 接收 数据 和 向 外 界 
输送 数据 的 部 分 。 

insert operation (插入 操作 ) 关系 数据 库 中 的 一 种 操作 ， 它 向 关系 中 插入 一 个 元 组 。 

insertion sort (插入 排序 ) 一 种 排序 算法 。 将 列表 中 未 排序 部 分 中 的 第 一 个 元 素 插入 该 列表 
已 排序 部 分 的 正确 位 置 。 

instruction (指令 ) 告诉 计算 机 要 做 什么 的 命令 。 

instruction register (指令 寄存 器 ) CPU 中 存放 待 控制 单元 解释 的 指令 的 寄存 器 。 

integer (整数 ) 整 型 数字 ， 没 有 分 数 部 分 。 

integrated circuit (集成 电路 ) 在 一 块 独立 芯片 上 集成 晶体 管 、 连 线 和 其 他 组 件 。 

integrity (完整 性 ) 保护 数据 ， 以 防 被 修改 、 插 入 、 删 除 或 回复 的 一 个 安全 目标 。 

intelligent agent (智能 体 ) 能 感知 环境 、 从 环境 中 学 习 和 能 智能 地 与 环境 进行 交互 的 一 种 主体 。 

internal level (内 层 ) 数据 库 中 定义 数据 实际 存储 位 置 的 部 分 。 

internal node (内 部 节点 ) 非 根 非 叶子 的 节点 。 

international organization for stand-ardization ( ISO) (国际 标准 化 组 织 ) 为 各 种 议题 定义 和 开 
发 标准 的 全 球 性 组 织 。 

internet (互联 网 ) internetwork 的 缩写 。 

Internet (因特网 ) 全 球 使 用 的 基于 TCP/IP 协议 体系 的 交互 式 网 络 。 

Internet address (因特网 地 址 ) 唯一 标识 因特网 上 计算 机 的 32 位 地 址 。 

internet mail access protocol ( IMAP ) (因特网 邮件 访问 协议 ) 把 电子 邮件 从 一 个 邮件 服务 
器 传送 到 邮件 接收 站 点 的 一 种 协议 。 

Internet protocol (IP) (网际 协议 ) ”在 TCP/IP 中 负责 在 网 络 计 算 机 间 传 送 数 据 包 的 网 络 层 的 协议 。 

Internet service provider (1SP )( 因 特 网 服务 提供 商 ) 提供 因特网 服务 的 组 织 机 构 。 

Internet static document (因特网 静态 文档 ) 万 维 网 上 的 ， 在 服务 器 上 创建 并 存储 在 服务 
器 上 的 内 容 固定 的 文档 (网 页 )。 
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internetwork (交互 式 网 络 ) 由 网 络 组 成 的 网 络 。 

interpreter (解释 器 ) 一 种 程序 ， 它 一 行 接 一 行 地 翻译 高 级 语言 源 程序 ， 并 立即 执行 每 一 行 。 

interrupt driven MO (中 断 驱 动 的 输入 /输出 ) 一 种 输入 /输出 形式 ，CPU 在 发 出 输入 / 输 
出 命令 后 继续 服务 其 他 进程 ， 直 到 它 收 到 那个 输入 / 输出 操作 已 经 完成 的 中 断 信号 。 

intersection operation ( 交 操 作 ) 两 个 集合 之 间 的 操作 ， 结 果 为 两 个 集合 之 间 的 公共 元 素 。 

intersector gap ( 扇 区 内 间隔 ) 磁盘 上 的 扇 区 间隔 。 

intertrack gap (磁道 内 间隔 ) 磁带 上 的 磁道 间隔 。 

intracoded frame (Il-frame) (内 部 编码 帧 ) 在 MPEG 中 ， 一 个 独立 的 帧 。 

inverted file ( 倒 排 文件 ) 根据 第 二 关键 字 进 行 排序 的 文件 。 

IP address (IP 地 址 ) 参见 Internet address。 

IP datagram (IP 数据 报 ) 网 络 层 的 数据 单元 。 

isolated I/O (单独 输入 /输出 ) 一 种 输入 /输出 模块 的 编 址 方法 ， 用 于 读 写 内 存 的 指令 完全 不 
同 于 读 写 输入 /输出 设备 的 指令 。 

Java (Java 语言) 一 种 面向 对 象 的 编程 语言 ， 用 于 创建 因特网 上 的 独立 执行 的 程序 或 动态 文档 。 

job (作业 ) 当 一 个 程序 被 选中 准备 执行 时 ， 这 个 程序 就 成 为 了 一 个 作业 。 

job scheduler (作业 调度 器 ) 用 来 选择 队列 中 的 某 个 任务 进行 处 理 或 等 待 移 人 内 存 的 调度 程序 。 

join operation (连接 操作 ) 在 关系 数据 库 中 将 两 个 关系 在 基于 某 一 共同 属性 的 基础 上 进行 
结合 的 操作 。 

joint photographic experts group (JPEG ) (联合 图 像 专家 组 ) 用 于 压缩 图 像 的 一 个 标准 。 

kernel (内 核 ) 操作 系统 的 主体 部 分 。 

key ( 键 ) 用 来 识别 一 个 记录 (结构 ) 的 一 个 或 多 个 字段 。 

key-distribution center (KDC) 可 信 的 第 三 方 ， 它 建立 通信 双方 共享 的 密 钥 。 

land ( 纹 间 表面 ) 光盘 中 ， 在 位 模式 的 转换 中 没有 被 激光 照射 的 区 域 ， 通 常 表示 1 位 。 

last in ，first out (LIFO) (后 进 先 出 ) 一 种 算法 ， 在 列表 中 最 后 被 添加 的 数据 项 最 先 移 出 。 

leaf (叶子 ) 图 或 树 中 出 度 为 0 的 叶子 。 

Lempel Ziv (LZ) encoding (LZ 编码 ) 一 种 使 用 字典 的 压缩 算法 。 

Lempel Ziv Welch (LZW) encoding (LZW 编码 ) LZ 压缩 编码 的 一 种 增强 版 本 。 

lexical analyzer (词法 分 析 器 ) 编译 过 程 中 使 用 的 一 种 程序 ， 它 一 个 符号 接 一 个 符号 去 读 
源 程序 ， 然 后 建立 符号 记号 表 。 

linear list (线性 列表 ) 一 种 列表 结构 ， 该 结构 中 除了 最 后 一 个 元 素 ， 其 他 每 个 元 素 都 有 唯 
一 的 后 继 。 

link( 链 ) 在 列表 结构 中 ， 标 识 列 表 中 下 一 元 素 的 字段 。 

linked list (链表 ) 元 素 的 排列 是 由 链接 域 决 定 的 线性 列表 结构 。 

linked list resolution (链表 解决 法 ) 散 列 方法 中 的 一 种 冲突 解决 方法 ， 它 为 同义词 使 用 分 
开 的 区 域 ， 该 区 域 在 链表 中 维护 。 

linked list traversal (链表 遍历 ) 一 种 按照 一 定 顺序 访问 链表 中 每 个 元 素 的 遍历 方法 。 

Linux (Linux 操作 系统 ) 由 Linus Torvalds 开发 的 一 种 操作 系统 ， 它 使 得 运行 在 Intel 微 处 
理 器 上 的 UNIX 更 为 有 效 。 

LISP ( 表 处 理解 释 语言 ) 把 每 个 事物 都 当成 表 的 一 种 表 处 理 语言 。 

list (列表 ) 在 主 存 中 按照 一 定 顺序 组 织 的 数据 集 。 区 别 于 文件 。 
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listserv (管理 讨论 邮件 清单 的 程序 ) 因特网 中 的 一 个 应 用 程序 。 

literal (文字 ) 在 程序 中 使 用 的 常量 。 

loader ( 载 人 程序 ) 将 可 执行 程序 装 入 内 存 运 行 的 操作 系统 函数 。 

local area network (LAN) (局域网 ) 连接 有 限 区 域内 设备 的 网 络 。 

local login (本 地 登录 ) 登录 至 连接 直接 终端 的 计算 机 。 

local variable (局 部 变量 ) 在 一 个 块 或 一 个 模块 中 定义 的 变量 。 

logical address (逻辑 地 址 ) 由 网 络 层 定义 的 地 址 。 

logical data (逻辑 数据 ) 值 为 真 或 假 的 数据 。 

logical operation (逻辑 操作 ) 结果 为 逻辑 值 ( 真 或 假 ) 的 操作 。 

logical shift operation (逻辑 移 位 操作 ) 一 种 不 保留 数字 符号 位 的 移 位 操作 。 

loop (循环 ) 程序 中 ,使 得 一 个 或 多 个 语句 重复 执行 的 一 种 结构 化 编程 结构 ; 在 图 中 指 一 
条 在 同一 顶点 开始 和 结束 的 线 。 

loop statement (循环 语句 ) 使 程序 重复 执行 其 他 一 些 语句 的 语句 。 

lossless data compression (无 损 数据 压缩 ) 没有 数据 丢失 的 数据 压缩 ; 用 于 压缩 文本 或 程序 。 

lossy data compression (有 损 数据 压缩 ) 允许 某 些 数据 丢失 的 数据 压缩 ;》 用 于 图 形 、 音 频 
或 视频 压缩 。 

machine language (机 器 语言 ) 无 须 进 行 汇编 或 编译 就 可 执行 的 基于 本 机 中 央 处 理 器 的 指令 。 

macro ( 宏 ) 由 用 户 定 制 设计 的 可 以 多 次 使 用 的 过 程 。 

magnetic disk (磁盘 ) 一 种 有 随机 存储 能 力 的 存储 媒介 。 

magnetic tape (磁带 ) 一 种 有 顺序 存储 能 力 的 存储 媒介 。 

main memory ( 主 存 ) ”计算 机 中 的 主要 内 存 ， 包 括 中 速 的 随机 存 取 存储 器 ， 参 照 cache memory。 

maintainability (可 维护 性 ) 指 保持 系统 正确 运行 和 更 新 的 品质 。 

mantissa (尾数 ) 表示 浮 点 数 精度 的 部 分 。 

mask ( 掩 码 ) 一 种 变量 或 常量 ， 它 们 包含 了 用 于 控制 位 逻辑 操作 中 位 设 定 的 一 种 位 配置 。 

masquerading (伪装 ) 一 种 对 信息 完整 性 的 攻击 ， 在 攻击 中 攻击 者 冒充 别人 。 

master file ( 主 文 件 ) 包含 与 应 用 程序 有 关 的 当前 最 新 数据 的 永久 保存 文件 。 

medium access control (MAC ) address (MAC 地 址 ) 参见 data link layer address。 

memory (内 存 ) 由 随机 存储 器 和 只 读 存 储 器 组 成 的 主要 存储 器 ， 用 于 存储 数据 和 程序 指令 。 

memory management (内 存 管理 ) 操作 系统 中 控制 主 存储 器 使 用 的 组 件 。 

memory-mapped I/O (内 存 映射 的 输入 /输出 ) 在 单一 地 址 空间 的 一 种 输入 /输出 模块 编 址 
方法 ， 既 用 于 内 存 也 用 于 输入 /输出 设备 。 

merging (合并 ) 一 种 在 图 像 分 割 中 使 用 的 方法 ， 具 有 相同 亮度 的 像素 点 被 合并 在 一 起 。 

mesh topology( 网 状 拓 扑 结构 ) 任 一 设备 都 可 以 与 其 他 每 个 设备 相连 的 拓扑 结构 。 

message authentication code (MAC) 包含 双方 机 密 的 消息 摘要 。 

message digest (消息 摘要 ) 对 消息 应 用 散 列 函数 而 得 到 的 固定 长 度 的 字符 串 。 

message transfer agent (MTA) 在 因特网 上 传输 消息 的 SMTP 程序 。 

method (方法 ) 面向 对 象 语言 中 的 函数 。 

metropolitan area network (MAN) ( 城 域 网 ) 遍及 一 个 城镇 的 网 络 。 

microcomputer (微型 计算 机 ) 体积 相对 较 小 ， 可 置 于 桌面 的 计算 机 。 

Microsoft disk operating system (MS-DOS) 基于 DOS 的 操作 系统 ， 由 微软 开发 。 


modal logic ( 模 态 逻辑 ) 包含 确定 性 和 可 能 性 的 扩展 逻辑 。 

modularity (模块 化 ) 把 大 的 工程 分 解 成 小 的 部 分 ， 以 利于 理解 和 操作 。 

module (模块 ) 对 工程 使 用 模块 化 后 建立 的 一 个 小 部 分 。 

modulo division ( 求 模 ) 将 两 数 相 除 并 保留 余数 。 

monoprogramming ( 单 道 程序 ) 在 每 一 时 刻 只 允许 一 个 程序 存在 内 存 中 的 技术 。 

moving pictures experts group (MPEG) (运动 图 像 专 家 组 ) 一 种 用 来 压缩 音频 和 视频 信号 
的 有 损 压缩 方法 。 

MPEG audio layer (MP3 ) (MPEG 第 三 代 音 频 压缩 格式 ) 基于 MPEG 的 音频 压缩 标准 。 

multidimensional array (多 维 数组 ) 元 素 有 一 级 以 上 索引 的 数组 。 

multidrop connection (多 点 连接 ) 参见 multipoint connection。 

multiplexing (多 路 复 用 ) 为 传输 而 进行 的 多 源 信息 和 数据 的 复合 过 程 。 

multipoint connection (多 点 连接 ) 两 个 或 两 个 以 上 设备 共享 链 路 能 力 的 连接 方式 。 

multiprogramming (多 道 程序 ) 允许 一 个 以 上 程序 驻 于 内 存 中 并 被 处 理 的 技术 。 

multipurpose internet mail extension ( MIME ) (多 用 途 因 特 网 邮件 扩充 协议 ) 对 SMTP 协议 
的 补充 ， 允 许 非 ASCII 码 的 数据 通过 SMTP 进行 传送 。 

multithreading (多 线程 ) 某 些 语言 ， 如 Java 所 支持 的 并 行 处 理 。 

mutual exclusion 〈 互 斥 ) 由 操作 系统 强加 于 资源 之 上 的 一 种 情形 ， 该 情形 是 有 的 资源 只 能 
被 一 个 进程 持 有 。 

network (网 络 ) 一 个 连接 多 个 可 共享 资源 节点 的 系统 。 

network layer (网络 层 ) TCP/IP 模型 中 的 第 三 层 ; 负责 从 起 始 主机 发 送 包 至 最 终 目标 。 

network model (网 络 模 型 ) 一 种 数据 库 模型 ， 该 模型 中 一 个 记录 可 以 有 多 个 父 记录 。 

neural network (神经 网 络 ) 人 脑 中 的 神经 元 网 络 。 

neuron (神经 元 ) 在 人 脑 和 神经 系统 中 负责 传送 信息 的 个 体 单元 。 

new master file (新 主 文件 ) 当 文 件 更 新 时 ， 由 旧 文 件 创建 而 来 的 主 文件 。 

no preemption ( 非 抢占 式 ) 操作 系统 不 能 临时 分 配 资源 的 情形 。 

node (节点 ) 在 数据 结构 中 ， 既 包含 数据 也 包含 处 理 该 数据 结构 的 结构 化 元 素 的 一 种 元 素 。 

node-to-node delivery (点 对 点 传递 ) 由 一 个 节点 传 向 下 一 个 节点 的 数据 传递 。 

nonpolynomial problem ( 非 多 项 式 问 题 ) 不 能 用 多 项 式 复 杂 性 解决 的 问题 。 

nonpositional number system ( 非 位 置 数字 系统 ) 一 种 数字 系统 ， 符 号 的 位 置 不 定义 符号 的 值 。 

nonrepudiation (认可 ) 接收 到 的 消息 的 一 种 性 质 ， 该 性 质 不 允许 发 送 者 抵赖 已 发 送 的 消息 。 

normal form (NF)( 范 式 ) 关系 数据 库 规 范 化 过 程 中 的 一 步 。 

normalization (规范 化 ) 在 关系 数据 库 中 同一 个 关系 数据 模型 应 用 范式 的 进程 。 

NOT operation (“ 非 ”操作 ) 将 0 变 1 或 将 1 变 0 的 操作 。 

NT file system (NTFS )(NT 文件 系统 ) Windows NT 及 以 后 版 本 中 的 标准 文件 系统 。 

null pointer ( 空 指针 ) 不 指向 任何 数据 的 指针 。 

null tree ( 空 树 ) 不 含 节 点 的 树 。 

number system (数字 系统 ) 使 用 一 套 符 号 定义 一 个 值 的 系统 。 

object program (目标 程序 ) 由 编译 程序 或 解释 程序 产生 的 机 器 语言 代码 。 

object-oriented analysis (面向 对 象 分 析 ) 使 用 面向 对 象 语言 的 开发 过 程 中 的 分 析 阶 段 。 

object-oriented database (面向 对 象 数据 库 ) 一 种 数据 被 当 作 结 构 (对 象 ) 进行 处 理 的 树 据 库 。 
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object-oriented language (面向 对 象 语言 ) 一 种 将 对 象 及 其 相关 操作 绑 定 在 一 起 的 程序 设 
计 语 言 。 

object-oriented paradigm (面向 对 象 范式 ) 程序 作用 于 活动 对 象 的 范式 。 

octal system (八进制 系统 ) 以 8 为 基 的 数字 系统 ; 八进制 数字 为 0 一 7。 

old master file( 旧 主 文件 ) 该 主 文件 与 事务 文件 相互 关联 用 于 创建 新 主 文件 。 

one's complement (二 进 制 的 反 码 ) 将 变量 中 的 值 按 位 取 反 的 位 运算 。 

one's complement representation (二 进 制 的 反 码 表示 ) 一 种 把 一 个 负数 用 一 个 正 数 的 反 
码 表 示 的 整数 表示 方法 。 

one-dimensional array (一 维 数组 ) 只 有 一 级 索引 的 数组 。 

open addressing resolution (开放 寻 址 解决 法 ) 当 新 的 地 址 在 主 区 时 的 一 种 冲突 解决 法 。 

operability (可 操作 性 ) 描述 系统 可 用 程度 的 品质 因素 。 

operand (操作 数 ) 语句 中 执行 运算 的 对 象 。 与 运算 符 相 对 应 。 

operating system (操作 系统 ) 能 够 控制 计算 环境 并 能 提供 用 户 接口 的 软件 。 

operator (运算 符 ) 一 种 表示 在 数据 (操作 数 ) 上 运算 操作 的 语法 标记 。 与 操作 数 相 对 应 。 

optical storage device( 光 存储 设备 ) 一 种 使 用 光 ( 激 光 ) 来 存储 和 检查 数据 的 IO 设备 。 

OR operation (“或 ”操作 ) 仪 当 两 个 输入 皆 为 0 时 结果 才 为 0， 其 他 情况 为 1 的 二 进 制 操作 。 

output data (输出 数据 ) 运行 计算 机 程序 的 结果 。 

output device (输出 设备 ) 只 可 写 而 不 可 读 的 设备 。 

overflow (溢出 ) 该 情况 发 生 在 试图 用 不 足够 的 位 去 表示 一 个 二 进 制 数值 。 

page (页 ) 程序 中 众多 大 小 相等 的 扇 区 中 的 一 个 。 

paging (分 页 调度 ) 一 种 多 道 程 序 技术 ,该 技术 将 内 存 分 成 称 为 帧 的 大 小 相等 的 扇 区 。 

palette color ( 调 色 板 ) 参见 indexed color。 

parallel system (并 行 系统 ) 在 同一 机 器 上 有 多 个 CPU 的 操作 系统 。 

parameter (参数 ) 传 给 函数 的 值 。 

parameter list (参数 列表 ) 传 给 函数 的 一 组 值 列表 。 

parent ( 父 类 ) 有 一 个 或 多 个 子 类 节点 的 树 节点 或 图 节点 。 

parsing (( 语 法 ) 分 析 ) 将 数据 分 割 成 数据 或 标记 的 过 程 。 

partitioning (分 区 调度 ) 一 种 多 道 程序 技术 ， 它 将 内 存 分 成 可 变 大 小 的 区 。 

Pascal ( Pascal 语言 ) 按 一 种 特殊 目的 设计 的 程序 语言 ， 即 通过 强调 结构 化 编程 方法 向 初 
学 者 传授 程序 设计 。 

”pass by reference ( 按 引用 传送 ) 一 种 参数 传递 技术 ， 被 调用 的 函数 通过 使 用 一 个 别名 来 
引用 传递 的 参数 。 

pass by value ( 按 值 传送 ) 将 变量 的 值 传 给 函数 的 一 种 参数 传送 技术 。 

passive hub (无 源 插 孔 ) 一 种 不 会 重新 生成 数据 的 连接 设备 。 

password-based authentication (基于 口令 的 身份 验证 ) 一 种 简单 古老 的 实体 身份 验证 ， 
口令 被 用 来 标识 申请 者 。 

path〈 路 径 ) 顶点 相 邻 的 一 系列 节点 。 

perceptron (感知 器 ) 在 神经 网 络 中 ， 一 个 简单 的 类 似 于 神经 元 的 元 素 。 

PERL (PERL 语言 种 高 级 语言 (语法 类 似 于 C)， 使 用 规则 的 表达 式 ， 允 许 解 析 字 符 串 
到 组 件 中 。 
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physical address (物理 地 址 ) 在 数据 链 路 层 的 设备 的 地 址 。 

physical agent (物理 智能 体 ) 能 用 来 执行 一 系列 任务 的 可 编程 系统 (机 器 人 )。 

physical layer (物理 层 ) TCP/IP 模型 中 的 第 一 层 ; 负责 在 网 络 中 的 信号 和 位 传送 。 

picture element (pixel) (像素 ) 图 像 的 最 小 单位 。 

pit ( 坑 ) 在 光盘 中 被 激光 烧灼 后 形成 的 区 域 ， 用 于 表示 位 模式 下 信息 ， 通 常 表示 0。 

pixel (像素 ) 参见 picture element。 

place value (位 置 量 ) 在 位 置 数字 系统 中 ， 与 位 置 相关 联 的 值 。 

plaintext (明文 ) 加 密 前 的 原文 。 

pointer (指针 ) 存放 地 址 的 变量 或 常量 ， 可 以 访问 放置 于 他 处 的 数据 。 

point-to-point connection (点 到 点 连接 ) 两 设备 间 的 专用 传输 。 

polycarbonate resin ( 育 碳 酸 酯 树脂 ) 在 CD-ROM 制作 中 ， 一 种 注入 模子 中 的 材料 。 

polymorphism (多 态 ) 在 C++ 中 ,使 用 同一 个 名 字 定 义 多 个 操作 以 便 在 相关 类 中 做 不 同事 情 。 

polynomial problem (多 项 式 问 题 ) 能 够 在 可 接受 的 时 间 范 围 内 由 计算 机 解决 的 问题 。 

pop (出 栈 ) 栈 的 删除 操作 。 

port address (端口 地 址 ) 见 port number。 

port number (端口 号 ) 在 TCP 和 UDP 中 ， 用 来 区 分 不 同 进程 的 地 址 。 

portability (可 移植 性 ) 描述 一 个 操作 系统 可 以 移植 到 其 他 的 硬件 环境 中 难 易 程 度 的 品质 因数 。 

positional number system (位 置 数 字 系 统 ) 一 种 符号 的 位 置 定义 了 其 值 的 数字 系统 。 

postfix (后 级 ) 一 种 把 运算 符 放 置 在 其 操作 数 之 后 的 算术 符号 。 

postorder traversal (后 序 遍 历 ) 先 访问 左 子 树 ， 再 访问 右 子 树 ， 最 后 访问 根 的 二 叉 树 遍历 
方法 。 

pragmatic analysis ( 语 用 分 析 ) 一 种 句子 的 分 析 方法 ， 通 过 排除 二 义 性 ， 发 现 单词 的 真实 
含义 。 

predicate logic (谓词 逻辑 ) 一 种 逻辑 系统 ， 其 中 的 量词 能 应 用 于 项 (term), 但 不 能 应 用 于 
谓词 。 

predicted frame (P-frame) ( 预 帧 ) 在 MPEG 中 ,与 在 前 的 1 帧 和 B 帧 相关 的 帧 。 

prefix (前 缀 ) 一 种 把 运算 符 放 置 在 其 操作 数 之 前 的 算术 符号 。 

preorder traversal (前 序 遍 历 ) 二 又 树 的 一 种 遍历 方法 ， 该 遍历 算法 遍历 顺序 为 先 访问 左 
子 树 ， 再 访问 根 ， 最 后 访问 右 子 树 。 

prime area ( 主 区 ) 在 一 个 散 列 表 中 ， 该 存储 区 域 包含 内 部 地 址 。 

private key ( 私 钥 ) 公开 密 钥 密码 体系 的 两 种 密 钥 之 一 。 

probe (探查 ) 在 散 列 算法 中 用 于 计算 地 址 和 测试 成 功 与 否 ; 在 查找 算法 中 ， 则 是 指 包含 查 
找 参 数 测试 的 一 种 迭代 循环 。 

procedural language (过 程 化 语言 ) 过 程 化 范式 中 的 计算 机 语言 。 

procedure paradigm (过 程 化 范式 ) 程序 使 用 过 程 作 用 于 被 动 对 象 的 范式 。 

procedure (过 程 ) 子 算法 的 另 一 术语 。 

procedure-oriented analysis (面向 过 程 分 析 ) 开发 过 程 中 的 一 个 分 析 阶 段 ， 该 开发 是 使 用 过 
程 化 语言 进行 的 开发 。 

procedure-oriented design (面向 过 程 设计 ) 开发 过 程 中 的 一 个 设计 阶段 ， 该 开发 是 使 用 
过 程 化 语言 百 进行 的 开发 。 
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process (进程 ) 正在 执行 的 程序 。 

process manager (进程 管理 器 ) 操作 系统 中 用 来 控制 进程 的 组 件 。 

process scheduler (进程 调度 器 ) ”一 种 操作 系统 机 制 ， 它 用 来 分 配 那些 正在 等 待 使 用 CPU 的 
进程 。 

process synchronization (进程 同步 ) 一 种 操作 系统 机 制 , 用 来 控制 多 个 进程 对 共享 资源 的 访问 。 

process-to-process communication (进程 间 通 信 ) 两 台 计 算 机 在 传输 层 上 的 通信 。 

process-to-process delivery (进程 间 分 发 ) 把 源 计 算 机 传输 层 上 的 一 个 数据 包 分 发 到 目标 
计算 机 的 传输 层 上 。 

program (程序 ) 一 系列 指令 的 集合 。 

program counter (程序 计数 器 ) CPU 中 的 一 个 寄存 器 ， 它 存 有 内 存 中 下 一 条 将 被 执行 指令 
的 地 址 。 

programmable data processor (可 编程 数据 处 理 器 ) 输入 数据 和 程序 而 得 到 输出 数据 的 机 器 。 

programmable read-only memory ( PROM ) (可 编程 只 读 存储 器 ) 由 制造 商用 电 设置 好 内 
容 的 存储 器 ; 它 可 以 被 用 户 重新 设置 。 

programmed IO (程序 控制 输入 /输出 ) 输入 /输出 的 一 种 形式 ， 在 这 种 形式 中 CPU 必须 
等 待 输入 / 输出 操作 结束 。 

programming language (程序 设计 语言 ) 一 种 具有 有 限 词汇 和 语法 规则 的 语言 ， 它 用 于 解 
决 计算 机 上 的 问题 。 

project operation (投影 操作 ) 在 关系 数据 库 中 的 一 种 操作 ， 根 据 某 种 标准 选择 列 集 。 

Prolog (Prolog 语言 ) 一 种 建立 在 正规 逻辑 基础 上 的 高 级 程序 设计 语言 。 

PROLOG (PROLOG 语言 ) 一 种 能 建立 事实 数据 库 和 规则 知识 库 的 编程 语言 。 

Propositional Logic (命题 逻辑 ) 一 种 基于 逻辑 操作 符 和 命题 术语 的 逻辑 系统 。 

protocol (协议 ) 在 计算 机 间 交 换 数据 的 规则 集 。 

pseudocode〔 伪 代码 ) 类 似 英语 的 语句 ， 它 遵从 松散 的 语法 定义 ， 并 用 来 表达 某 种 算法 或 
功能 的 设计 。 

public key ( 公 钥 ) 公 钥 加 密 中 的 一 种 密 钥 ， 它 对 公众 公开 。 

public key encryption (〈 公 钥 加 密 ) 使 用 两 种 密 钥 ( 公 钥 和 私 钥 ) 的 加 密 技 术 ， 私 钥 是 保密 
的 ， 公 钥 是 公开 的 。 

public-key certificate (〈 公 钥 证 书 ) 一 种 把 实体 与 公 钥 捆 绑 在 一 起 的 证 书 。 

push (入 栈 ) 栈 中 的 插入 操作 。 

quantifier (量词 ) 谓词 逻辑 中 使 用 的 两 个 运算 符 : V 和 了。 

quantization (量化 ) 从 一 个 有 限 的 值 集中 分 配 值 。 

queue (队列 ) 一 种 线性 表 ， 数 据 只 能 在 一 端 插入 ， 称 为 队 尾 ， 而 且 只 能 在 另 一 端 删除 ， 称 
为 队 首 。 

radix ( 基 ) 位 置 数 字 系 统 中 的 基 。 

random access( 随 机 存 取 ) 一 种 存储 方法 ， 它 允许 按 任 意 次 序 存 取 数 据 。 

random access memory (RAM) (随机 存 取 存储 器 ) 计算 机 的 主 存储 器 ， 它 存储 数据 和 程序 。 

raster graphic (光栅 图 形 ) 参见 bitmap graphic。 

read/write head ( 读 / 写 头 ) 硬盘 中 读 / 写 数据 的 设备 。 

read-only memory (ROM )( 只 读 存 储 器 ) 持久 性 存储 器 ， 其 存储 内 容 不 可 改变 。 
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ready state (就 绪 状 态 ) 在 进程 管理 中 ， 处 于 这 种 状态 的 进程 正 等 待 获 得 CPU 的 使 用 权 。 

real (实数 ) 有 整数 部 分 和 小 数 部 分 的 数字 。 

real-time system (实时 系统 ) 一 种 操作 系统 ， 它 能 在 指定 的 时 间 限 制 下 完成 一 项 任务 。 

rear (尾部 ) 使 用 人 队列 操作 时 ， 最 后 一 个 捅 到 队列 中 的 元 素 。 

record (记录 ) 描述 一 实体 的 信息 。 

recursion (递归 ) 一 个 设计 成 自我 调用 的 函数 。 

reduced instruction set computer ( RISC ) (精简 指令 集 计 算 机 ) 一 种 只 使 用 那些 常用 指令 
的 计算 机 。 

register (寄存 器 ) 一 种 可 存放 临时 数据 的 快速 独立 的 存储 单元 。 

relation (关系 ) 关系 数据 库 中 的 表 。 

relational database (关系 数据 库 ) 一 种 数据 库 模 型 ， 数 据 组 织 在 被 称 为 关系 的 相关 表 中 。 

relational database management system ( RDBMS ) (关系 数据 库 管 理 系统 ) 用 来 处 理 关 
系数 据 库 模 型 中 关系 的 程序 集 。 

relational model (关系 模型 ) 参见 relational database。 

relational operator (关系 运算 符 ) 一 种 用 于 比较 两 个 值 的 运算 符 。 

reliability (可 靠 性 ) 描述 系统 总 体操 作 的 可 信和 可 人 靠 程度 的 品质 因素 。 

remote login 〈 远 程 登 录 ) 登录 到 与 本 地 计算 机 相连 的 远程 计算 机 上 。 

repetition (循环 ) 结构 化 编程 中 的 三 种 结构 之 一 。 

replaying (回复 ) 一 种 对 信息 完整 性 的 攻击 ， 攻 击 者 先 截 取消 息 ， 再 重新 传送 。 

replicated distributed database (复制 的 分 布 式 数 据 库 ) 一 种 在 每 个 站 点 都 拥有 另 一 站 点 
的 副本 的 数据 库 。 

repudiation (抵赖 ) ”对 信息 完整 性 的 一 种 攻击 , 由 通信 双方 中 的 任 一 方 发 起 : 发 送 者 或 接收 者 。 

reserved words (保留 字 ) 语言 中 已 经 有 预定 解释 并 不 能 为 用 户 所 定义 的 字 集 合 。 

resolution (分 辨 率 ) 图 像 处 理 中 的 扫描 速率 : 用 每 单元 中 像素 点 的 数目 来 表示 。 

resource holding (资源 持 有 ) 一 种 状态 : 进程 持 有 一 个 资源 ， 却 不 能 使 用 ， 一 直 要 等 到 所 
有 其 他 资源 也 可 用 。 

restricted list (限制 列 表 ) 这 种 列表 的 数据 追加 或 删除 操作 只 能 在 列表 的 末尾 ， 而 且 数 据 处 
理 也 被 限制 在 数据 末尾 进行 操作 。 

retrieval (检索 ) 查找 并 返回 列表 中 某 个 元 素 的 值 。 

RGB ( 红 绿 蓝 ) 一 种 颜色 系统 ， 其 中 色彩 用 红 、 绿 、 蓝 三 主 色 的 组 合 来 表示 。 

ring topology ( 环 型 拓扑 结构 ) 一 种 将 设备 连接 成 环 状 的 拓扑 结构 ， 每 一 个 设备 从 邻 站 接收 
数据 单元 并 转发 给 另 一 个 邻 站 。 

Rivest-Shamir-Adleman ( RSA) encryption (RSA 加 密 法 ) 一 种 通用 的 公共 密 钥 的 加 密 / 
解密 方法 。 

Roman number system (罗马 数字 系统 ) 罗马 人 使 用 的 非 位 置 数字 系统 。 

root ( 根 ) 树 的 第 一 个 节点 。 

rotational speed (角速度 ) 磁盘 的 旋转 速度 。 

router (路 由 器 ) 一 种 工作 在 TCP/IP 体系 前 三 层 的 连接 独立 网 络 的 设备 。 路 由 器 根据 数据 包 
的 目的 地 址 来 确定 它 的 路 由 。 

routing (路 由 ) 路 由 器 的 工作 过 程 。 
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routing table (路 由 表 ) 对 于 一 个 数据 包 ， 该 路 由 器 可 选择 的 所 有 路 由 。 

row-major storage ( 行 主 序 存储 ) 内 存 中 存储 数组 元 素 的 一 种 方法 ， 数 组 元 素 一 行 一 行 地 
存储 。 

ruled-based system (基于 规则 的 系统 ) 一 种 知识 表示 系统 ， 其 中 使 用 一 套 规则 ， 从 已 知 的 
事实 推出 新 的 事实 。 

run-length encoding (游程 长 度 编码 ) 一 种 无 损 压 缩 方 法 ， 在 这 种 编码 方法 中 ， 一 系列 的 重 
复 符 号 由 该 符号 和 重复 的 个 数 来 表示 。 

running state (运行 状态 ) 在 进程 管理 中 ， 进 程 使 用 CPU 的 状态 。 

sampling (采样 ) 等 间隔 地 测量 。 

sampling rate (采样 率 ) 在 采样 过 程 中 每 秒 钟 采集 到 的 样本 数 。 

scanning (扫描 ) 图 像 到 数字 化 数据 的 转换 ， 通 过 对 均匀 分 布点 的 密度 和 色彩 进行 采样 。 

scheduler (调度 程序 ) 把 作业 从 一 个 状态 转换 到 另 一 个 状态 的 程序 。 

scheduling (调度 ) 为 不 同 的 程序 分 配 操作 系统 的 资源 ， 并 且 决 定 什么 时 间 什 么 程序 使 用 哪 
个 资源 。 

scheme (模式 ) LISP 语言 的 实际 标准 。 

search space (查找 空间 ) 可 能 状态 的 集合 ， 使 用 查找 方法 进行 问题 求解 时 要 查找 的 状态 空间 。 

searching (查找 ) 根据 预先 指定 值 作为 查找 参数 ， 在 查找 表 的 过 程 中 确定 一 个 或 多 个 包含 
给 定 元 素 的 过 程 。 

secondary storage device (二 级 存储 设备 ) 参见 auxiliary storage 。 

secret key ( 密 钥 ) 保密 密 钥 加 密 体系 中 仅 被 两 个 参与 者 享有 的 钥匙 。 

sector ( 扇 区 ) 磁盘 磁道 的 一 部 分 。 

security (安全 ) 一 种 描述 未 授权 用 户 访问 数据 难 易 程 度 的 品质 因素 。 

secutiry attack (安全 攻击 ) 一 种 对 系统 安全 目标 形成 威胁 的 攻击 。 

security goal.( 安 全 目标 ) 信息 安全 三 个 目标 之 一 : 机 密 性 、 完 整 性 和 可 用 性 。 

seek time ( 寻 道 时 间 ) 在 访问 磁盘 中 ， 需 要 移动 读 / 写 磁 头 到 数据 所 在 磁道 的 时 间 。 

segmentation (分 割 ) 图 像 处 理 中 的 一 个 步骤 ， 它 把 图 像 分 成 均匀 的 片段 或 区 域 。 

select operation (选择 操作 ) 关系 数据 库 中 一 种 选择 元 组 集 的 操作 。 

selection (选择 ) 结构 化 编程 中 三 种 结构 之 一 。 

selection sort (选择 排序 ) 一 种 排序 算法 ， 未 排序 子 表 中 的 最 小 元 素 被 选择 出 来 ， 放 置 在 
已 排序 子 表 的 末尾 。 

self-referential record ( 自 引 用 记录 ) 这 种 记录 的 一 部 分 用 来 指向 其 他 同类 型 的 记录 。 

semantic analysis (语义 分 析 ) 对 句子 中 的 单词 或 语句 中 的 符号 的 含义 进行 分 析 。 

semantic network (语义 网 ) 一 种 节点 代表 对 象 ， 边 代表 对 象 间 的 关系 的 图 。 

sequence (顺序 ) 结构 化 编程 中 的 三 种 结构 之 一 。 

sequential access (顺序 存 取 ) ”一 种 存 取 方 法 ， 文 件 中 的 记录 只 能 从 第 一 个 元 素 开 始 连 续 地 存 取 。 

sequential file (顺序 文件 ) 一 种 文件 结构 ， 文 件 中 的 数据 必须 从 第 一 个 元 素 开 始 连续 地 处 理 。 

sequential search (顺序 查找 ) 一 种 用 于 线性 列表 查找 的 技术 ， 查 找 过 程 为 从 第 一 个 元 素 
开始 逐个 查找 ， 直 到 元 素 的 值 等 于 找到 的 值 ， 否 则 继续 查找 直到 列表 的 末尾 。 

server (服务 器 ) 客户 机 - 服务 器 系统 中 提供 辅助 服务 (服务 器 程序 ) 的 集中 计算 机 。 

shell (命令 行 解释 器 ) 某 些 操作 系统 的 用 户 界面 ， 如 UNIX。 


大 语 页 417 


shift cipher ( 移 位 加 密 ) 一 种 替换 加 密 ， 其 中 的 密 钥 定 义 了 字母 向 字母 表 尾 部 的 移动 。 

siblings (兄弟 节点 ) 具有 同一 双亲 的 节点 。 

side effect (副作用 ) 由 一 个 表达 式 赋 值 而 导致 的 变量 值 的 改变 ; 由 一 个 调用 函数 执行 的 输 
入 /输出 。 

sign-and-magnitude representation (符号 加 绝对 值 表示 法 ) 一 种 整数 的 表示 方法 ， 其 中 一 
位 用 来 表示 符号 ， 其 余 位 则 表示 数量 大 小 。 

simple, ail transfer protocol(SMTP )( 简 单 邮 件 传 输 协 议 ) TCP/IP 协议 中 用 于 邮件 服务 的 协议 。 

single-user operating system ( 单 用 户 操作 系统 ) 一 种 一 次 内 存 中 只 能 有 一 个 程序 可 以 运 
行 的 操作 系统 。 

small computer system interface ( SCS1) (小 型 计算 机 系统 接口 ) 一 种 带 并 行 接口 的 输入 / 
输出 设备 控制 器 。 

snooping ( 嗅 探 ) 对 机 密 信 息 的 非 授权 访问 。 

software (软件 ) 用 来 帮助 计算 机 完成 工作 所 必需 的 应 用 程序 和 系统 程序 。 

software agent (软件 智能 主体 ) 在 人 工 智 能 应 用 系统 中 ， 被 设计 出 来 处 理 特 殊 任务 的 程序 

全 

software engineering (软件 工 程 ) 结构 程序 的 设计 和 编写 。 

software lifecycle (软件 生命 周期 ) 软件 包 的 寿命 。 

solvable problem (可 解 问题 ) 一 个 可 用 计算 机 解决 的 问题 。 

soma ( 胞 体 ) 含有 细胞 核 的 神经 细胞 体 。 

something inherent (所 固有 的 ) 申请 者 的 特征 ， 如 : 常见 的 签名 、 指 纹 和 声音 等 可 用 来 进 
行 实体 身份 验证 。 

something known (所 知道 的 ) 申请 者 所 知道 的 秘密 ， 这 些 秘密 可 被 身份 验证 中 的 验证 程序 
使 用 。 

something possessed (所 拥有 的 ) 属于 申请 者 ， 能 标明 申请 者 身份 的 东西 。 

sort pass (分 类 扫描 ) 在 一 个 循环 中 由 一 个 分 类 程序 检测 所 有 的 元 素 。 

sorting (排序 ) 用 来 对 列表 或 文件 进行 排序 的 处 理 过 程 。 

source program ( 源 程序 ) 包含 有 程序 员 撰 写 的 未 被 转化 为 机 器 语言 的 程序 语句 的 文件 ; 
给 汇编 程序 或 编译 器 的 输入 文件 。 

source-to-destination delivery ( 源 至 目的 地 的 传送 ) 指 将 数据 包 从 源 到 目的 地 的 传送 。 

spatial compression (空间 压缩 ) 对 帧 进行 JPEG 压缩 。 

speech recognition (语音 识别 ) 自然 语音 处 理 的 第 一 步 (人 工 智 能 )， 语 音信 号 被 分 析 ， 其 
中 所 包含 的 单词 序列 被 抽取 出 来 。 

spoofing (哄骗 ) 参见 masquerading。 

stack ( 栈 ) 一 个 受 限 制 的 数据 结构 ， 其 数据 插入 和 删除 只 能 在 称 为 栈 顶 的 一 端 进行 。 

star topology( 星 型 拓扑 结构 ) 一 种 所 有 计算 机 都 连接 在 同一 个 公共 集线器 上 的 拓扑 结构 。 

starvation( 饿 死 ) 一 种 操作 系统 操作 上 的 问题 ， 这 种 情况 下 一 个 进程 无 法 获取 所 需 的 资源 
进行 工作 。 

state chart (状态 图 ) 一 种 与 状态 图 类 似 的 图 ， 但 在 面向 对 象 软 件 工程 中 使 用 。 

state diagram (状态 图 ) 用 来 表示 程序 不 同 状 态 的 图 。 

statement (语句 ) C 语言 中 的 一 种 句法 构造 ， 用 来 描述 函数 操作 。 
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static document (静态 文档 ) 在 远程 站 点 创建 ， 由 本 地 站 点 下 载 的 网 页 。 相 对 于 动态 文档 。 

static RAM ( SRAM ) (静态 随机 存储 器 ) 一 种 利用 传统 触发 器 门 电路 (只 含有 0 或 1 两 种 状 
态 的 门 电路 ) 来 保存 数据 的 技术 。 

statistical compression (统计 压缩 ) 一 种 基于 符号 频率 编码 的 压缩 方法 。 

steganography ( 隐 写 术 ) 一 种 安全 技术 ， 通 过 在 消息 上 覆盖 其 他 东西 来 隐藏 消息 。 

storage device (存储 设备 ) 一 种 能 够 存储 大 量 信 息 并 可 在 将 来 检索 的 输入 /输出 设备 。 

stream control transmission protocol ( SCTP ) ( 流 控制 传输 协议 ) 为 因特网 上 的 电话 及 相 
关 应 用 而 设计 的 传输 层 协议 。 

structure chart (结构 图 ) 一 种 用 于 设计 和 文档 化 的 工具 ， 用 系统 功能 层次 流 图 来 描述 程序 。 

structured query language (SQL) (结构 化 查询 语言 ) 一 种 包括 对 了 数据 库 定 义 、 操 纵 和 
控制 的 数据 库 语 言 。 

subalgorithm ( 子 算法 ) 一 段 独立 编写 的 算法 。 它 可 为 算法 内 部 所 调用 执行 。 

subprogram ( 子 程序 ) 由 主 程序 调用 的 小 程序 。 

subroutine ( 子 例 程 ) 参见 subalgorithm。 

substitution cipher (替换 加 密 ) 把 一 个 符号 替换 成 另外 一 个 符号 的 加 密 。 

subtree ( 子 树 ) 在 树 根 下 的 任何 相连 的 结构 。 

summation ( 求 和 ) 一 系列 数字 相 加 的 结果 。 

symbolic language (符号 语言 ) 一 种 计算 机 语言 ， 比 机 器 语言 高 级 ， 它 通过 助 记 符号 来 表 
示 每 一 个 机 器 指令 并 具有 符号 数据 命名 的 能 力 。 

symmetric-key cryptography (对 称 密 钥 密码 术 ) 加 密 和 解密 使 用 同一 个 密 钥 的 密码 术 。 

symmetric-key encryption (对 称 密 钥 加 密 ) 使 用 对 称 密 钥 密 码 的 加 密 。 

synapse (神经 键 ) 在 人 类 神经 系统 中 两 个 神经 元 间 的 连接 。 

syndrome (故障 ) 当 对 代码 使 用 错误 检查 函数 时 产生 的 二 进 制 序列 。 

synonym (同义词 ) 在 散 列 表 中 ， 不同 的 关键 字 可 能 得 到 同一 内 部 地 址 。 

syntactic analysis (语法 分 析 ) 分 析 句 子 的 语法 。 

syntax (语法 ) 语言 的 “语法 ”规则 。 

syntax analyzer (语法 分 析 器 ) 检查 句子 语法 的 过 程 。 

system development life cycle (系统 开发 生命 周期 ) 开发 软件 所 需要 的 一 系列 步骤 ， 从 软 
件 需求 开始 ， 到 软件 实现 结束 。 

system documentation (系统 文档 ) 一 种 用 于 描述 软件 包 的 正式 的 整体 结构 的 记录 。 

TCP/IP protocol suite (TCP/IP 协议 族 ) 定义 因特网 传输 交换 的 五 层 协议 族 。 

TELNET (terminal network)( 终 端 网 络 ) 一 种 通用 的 允许 远程 登录 的 客户 机 - 服务 器 程序 。 

temporal compression (时 间 压 缩 ) MPEG 中 对 帧 的 压缩 。 

temporal logic (时 态 逻 辑 ) 一 种 在 推理 过 程 中 包含 了 时 间 的 变化 和 影响 的 逻辑 。 

terminal state ( 终 态 ) 状态 图 中 的 最 后 一 个 状态 。 

terminated state (终止 状态 ) 在 进程 管理 中 ， 进 程 完 成 运行 的 状态 。 

testability ( 易 测 性 ) ”一 种 软件 的 属性 ， 用 来 度量 软件 作为 可 操作 的 系统 来 测试 时 的 难 易 程 度 。 

testing phase (测试 阶段 ) 软件 生命 周期 中 用 来 测试 软件 包 是 否 正 常 工作 的 阶段 。 

text (文本 ) 以 字符 存储 的 数据 。 

text editor (文本 编辑 器 ) 一 种 创建 和 维护 文本 文件 的 软件 ， 例 如 Word 或 源 程序 编辑 器 。 
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text file (文本 文件 ) 所 有 数据 以 字符 形式 存储 的 文件 ,与 二 进 制 文件 相对 。 

thresholding( 阅 值 处 理 ) 图 像 分 割 中 使 用 的 一 种 方法 ， 指 定 亮度 的 像素 点 被 选择 出 来 ， 
然后 再 搜索 所 有 具有 相同 亮度 的 像素 点 。 

time sharing (分 时 ) 一 种 操作 系统 的 概念 ， 指 多 个 用 户 在 同一 时 刻 同时 访问 一 台 计 算 机 。 

token ( 助 记 符 ) 一 种 表示 运算 、 标 志 位 或 一 块 数据 的 语法 结构 。 

topology (拓扑 ) 包括 了 设备 物理 布局 的 网 络 结构 。 

track (磁道 ) 磁盘 中 的 一 部 分 。 

traffic analysis (流量 分 析 ) 对 机 密 信 息 的 一 种 攻击 ， 其 中 攻击 者 通过 监控 在 线 的 网 络 流量 
得 到 一 些 信息 。 

trailer ( 报 文 尾 ) 加 在 数据 单元 尾部 的 控制 信息 。 

transaction file (事务 文件 ) 包含 了 用 来 改变 主 文 件 内 容 的 相关 过 渡 过 程 数据 的 文件 。 

transfer time (传送 时 间 ) 用 来 表示 将 数据 从 磁盘 传送 到 CPU/ 内 存 所 需 的 时 间 。 

transferability (可 移植 性 ) 软件 系统 的 一 种 品质 ， 指 把 系统 从 一 个 平台 移植 到 男 一 个 平台 
的 能 力 。 

translator (翻译 程序 ) 一 种 语言 转换 程序 的 通用 术语 。 参 见 assembler 和 compiler。 

transmission control protocol (TCP)( 传 输 控 制 协 议 ) TCP/P 协议 族 中 的 传输 控制 层 协议 之 一 。 

transmission control protocol/Internet protocol (TCP/IP ) (传输 控制 协议 / 网 际 协议 ) 因 特 
网 上 所 使 用 的 正式 协议 ,该 协议 由 5 层 组 成 。 

transmission rate (传输 率 ) 每 秒 传输 的 位 数 。 

transport layer (传输 层 ) 处 于 TCP/IP 模型 中 的 第 四 层 ， 该 层 主 要 负责 全 部 消息 的 端 到 端 传输 。 

transposition cipher (调换 加 密 ) 调换 明文 中 的 符号 顺序 而 形成 密 文 ， 反 之 亦 然 。 

traversal (遍历 ) 一 种 用 于 对 结构 中 所 有 元 素 进 行 一 次 且 只 一 次 处 理 的 算法 。 

tree ( 树 ) 由 相互 连接 的 节点 集 组 成 ， 其 中 每 个 节点 只 有 一 个 前 驱 节 点 。 

true-color ( 真 彩 ) 在 光栅 图 形 中 用 24 位 表示 彩色 的 一 种 技术 。 

truncation error (截断 错误 ) 浮 点 表示 法 的 数字 在 存储 时 发 生 的 一 种 错误 ， 存储 的 数字 值 
可 能 不 如 想象 中 的 准确 。 

truth table ( 真 值 表 ) 该 表 列 出 了 所 有 可 能 输入 的 逻辑 值 的 组 合 及 其 相对 应 的 逻辑 输出 。 

tuple (元 组 ) 关系 数据 库 中 ， 关 系 的 一 个 记录 (一 行 )。 

Turing machine (图 灵机 ) 一 种 含有 三 个 部 件 的 计算 机 模型 (包括 磁带 、 控 制 器 和 读 / 写 头 )， 
它 可 以 实现 计算 机 语言 中 的 语句 。 

Turing model (图 灵 模 型 ) 基于 阿兰 . 图 灵 计 算 机 理论 定义 的 计算 机 模型 。 

Turing test (图 灵 测 试 ) 由 阿兰 . 图 灵 设 计 的 一 种 测试 ， 用 来 判断 计算 机 是 否 具有 真正 的 智能 。 

two’s complement (二 进 制 补 码 ) 一 种 二 进 制 数 表示 方法 ， 其 中 补 码 通过 对 其 所 有 位 取 反 
后 加 1 得 到 。 | 

two’s complement representation (二 进 制 补 码 表示 法 ) 一 种 整数 的 表示 方法 ， 其 负数 的 
表示 是 通过 将 其 正 数 的 原 码 中 从 最 右边 的 0 开始 到 出 现 第 一 个 1 之 间 的 位 保持 不 变 ， 而 其 
余 位 取 反 。 

two-dimensional array (二 维 数 组 ) 该 数组 中 元 素 具有 两 级 索引 。 参见 multidimensional array。 

type (类 型 ) 一 个 值 的 集合 和 定义 在 这 个 值 集 上 的 一 组 运算 。 

unary operation (一 元 操作 ) 该 操作 只 需要 一 个 操作 数 。 
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underflow (下 溢 ) 该 事件 发 生 在 从 一 个 空 数 据 结 构 中 删除 数据 。 

undirected graph (无 向 图 ) 一 种 只 含有 边 的 图 ， 也 就 是 说 该 图 中 节点 间 的 连 线 没有 方向 。 

Unicode (统一 字符 编码 标准 ) 32 位 字符 编码 ， 其 中 包含 了 世界 上 绝 大 多 数 语言 的 符号 和 字母 。 

Unified Modeling Language (UML) (统一 建 模 语言 ) 一 种 用 于 分 析 和 设计 的 图 形 化 语言 。 

Uniform Resource Locator (URL) (统一 资源 定位 器 ) 一 个 字符 串 ， 用 来 标识 因特网 中 的 
一 个 页 面 。 

union operation (并 操作 ) 一 种 基于 两 个 集合 的 操作 ， 操 作 的 结果 合并 了 两 个 集合 中 的 所 
有 元 素 ， 并 将 重复 元 素 去 除 。 

universal serial bus (USB) (通用 串 行 总 线 ) 一 种 串 行 IO 设备 控制 器 ， 它 将 如 鼠标 、 键 盘 
之 类 的 慢 速 设备 和 计算 机 连接 起 来 。 

UNIX (UNIX 操作 系统 ) 一 种 在 计算 机 程序 员 和 计算 机 科学 家 中 流行 的 操作 系统 。 

unsigned integer (无 符号 整数 ) 一 种 没有 符号 的 整数 ， 它 的 值 范围 为 0 到 正 无 穷 大 。 

unsolvable problem (不 可 解 问题 ) 计算 机 所 不 能 解决 的 问题 。 

update operation (更 新 操作 ) 在 关系 数据 库 中 的 一 种 改变 元 组 值 的 操作 。 

use case diagram (用 例 图 ) 在 UML 中 ， 显 示 系 统 用 户 视 图 的 图 。 

user agent (UA) (用 户 代理 ) SMTP 协议 的 一 个 组 成 部 分 ， 它 准备 消息 、 创 建 信封 和 把 消 
息 装 入 信封 。 

user datagram (用 户 数 据 报 ) 在 UDP 协议 中 使 用 的 数据 单元 名 称 。 

user datagram protocol (UDP) (用 户 数 据 报 协 议 ) 一 种 在 TCP/IP 协议 族 中 的 传输 层 协议 
之 一 。 

user interface (用 户 界面 ) 一 种 能 够 接受 用 户 (或 过 程 ) 请 求 的 程序 ， 并 将 其 解释 给 操作 
系统 的 其 他 部 分 进行 处 理 。 

utility (工具 ) UNIX 中 的 应 用 程序 。 

variable (变量 ) 它 是 一 种 存储 在 内 存 中 的 对 象 , 该 对 象 的 值 能 够 在 程序 执行 过 程 中 变化 。 
相对 于 常量 。 

vector graphic (矢量 图 ) 一 种 图 ， 该 图 中 的 线段 和 曲线 通过 数学 公式 来 定义 。 

verifying algorithm (验证 算法 ) 验证 数字 签名 合法 性 的 一 种 算法 。 

vertex (顶点 ) 图 中 的 一 种 节点 。 

video (视频 ) 图 像 ( 称 为 帧 ) 的 实时 显示 。 

videoconferencing (视频 会 议 ) 因特网 上 的 一 个 应 用 程序 。 

virtual memory (虚拟 内 存 ) 内 存 组 织 的 一 种 形式 ， 这 种 形式 允许 程序 在 内 存 和 磁性 存储 之 
间 使 用 交换 技术 以 使 得 用 户 在 使 用 的 过 程 中 感觉 内 存 比 实 际 物理 内 存 要 大 。 

von Neumann model ( 冯 : 诺 依 曼 模 型 ) 一 种 计算 机 模型 (包括 存储 器 、 算 术 逻 辑 单元 、 
控制 单元 、 输 入 /输出 子 系统 )， 现 代 计 算 机 正 是 基于 此 模型 结构 。 

waiting state (等 待 状态 ) 一 种 用 于 表示 进程 等 待 CPU 空闲 后 对 其 进行 处 理 的 等 待 状态 。 


waterfall model (瀑布 模型 ) 一 种 软件 开发 模型 ， 要 求 在 一 个 模块 开发 全 部 完成 之 后 再 开始 


下 一 个 模块 的 开发 。 
Web (万 维 网 ) 参见 world wide web。 
Web page (网 页 ) 一 种 能 够 在 网 站 上 提供 超 文 本 和 超 媒 体 的 单元 。 
white box testing ( 白 盒 测试 ) 一 种 程序 测试 方法 , 它 通过 考虑 程序 内 部 设计 来 测试 程序 也 
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称 为 玻璃 盒 测 试 。 相 对 于 黑金 测试 。 

wide area network (WAN ) (广域网 ) 一 种 覆盖 地 理 范 围 相 对 较 广 的 网 络 。 

Windows 2000 (Windows 2000 操作 系统 ) Windows NT 操作 系统 的 一 个 版 本 。 

Windows NT (Windows NT 操作 系统 ) 由 微软 开发 替换 MS-DOS 的 操作 系统 。 

Windows XP (Windows XP 操作 系统 ) Windows NT 操作 系统 的 一 个 版 本 。 

world wide web ( WWW) (万 维 网 ) 一 种 多 媒体 因特网 服务 ， 它 使 得 用 户 可 以 通过 链接 在 因 
特 网 中 浏览 不 同 的 文档 。 

write once, read many (WORM ) ( 写 一 次 ， 读 多 次 ) CD-R 的 另 一 个 名 字 。 

XOR operation( 异 或 运算 ) 一 种 位 逻辑 运算 ， 其 运算 规则 为 当 其 中 任 一 操作 数 为 1 时 运算 
结果 为 1。 

zero-knowledge authentication ( 零 知 识 身 份 验证 ) 一 种 实体 身份 验证 方法 ， 在 身份 验证 过 
程 中 申请 者 没有 显露 任何 危及 信息 机 密 性 的 东西 。 


